源文件:research/quant_digests/2026-04-11_0756_dynamic-secondfactor-basket-fade-alpha.md
common-trend stripped second-factor residual mean reversion / basket stat-arb —— 先把篮子里的共同大趋势(论文里基本就是 BTC-like market factor)剥掉,再去做第二因子驱动的相对错位回归;赌的不是单币方向,而是多腿 residual basket 会向因子均衡回摆15m portability probe(本地 proxy)一句话: base alpha = 把共同趋势因子剥掉以后,做第二因子主导的 residual basket mean reversion。
翻成人话:
所以它的归类是清楚的:
raw alpha:是relative-value / stat-arb / market-neutral:是filter / regime / overlay:不是 alpha 本体,但论文里的“第二因子仍然 stationary 才交易”是很关键的 admission layer来源信息先摆清楚:
10.1007/s10203-021-00318-x论文原始样本是:
BTC / ETH / LTC / XMR2016-01-01 到 2019-11-302019-01 到 2019-11 做策略评估作者不是只说“crypto 有协整”,而是更进一步: 这个 4 资产篮子,在 2019 年 8 月前后之前,更像“一个 integrated factor + 一个 stationary factor”的二因子系统。
原文 Table 3 给的 Johansen test 结果是:
r=0:stat 105.0086 > c value 40.1751r=1:stat 57.8639 > c value 24.2747r=2:stat 15.7722 > c value 12.3206r=3:p value 0.6356这等价于说: 4 条价格序列有 3 条 cointegrating relationships,也就是 1 条共同 integrated trend。
这一步很关键,因为它不是“随便找两条相关高的币”,而是先承认: 大部分价格漂移其实是共同行情因子。
作者先拟合一因子,再看残差协方差矩阵特征值:
(1184763.89, 6946.14, 185.03, 14.32)因此他们判断: 一条共同趋势不够,至少还需要第二个有效因子。
最后定下来的结构就是:
f1:integrated I(1) 因子f2:第二因子;在 2019 年 8 月底前大体 stationary,之后转坏原文 Table 4 参数:
β11 (BTC on factor1) = 0.9911β21 (ETH) = 0.0700β31 (LTC) = 0.0170β41 (XMR) = 0.0260论文还明确写到: 第一因子 essentially emulates the dynamics of Bitcoin。
也就是说,这里最像 desk 语言的解读其实是:
f1 ≈ 市场共同大趋势 / BTC-like betaf2 ≈ 脱离共同趋势之后的次级相对错位因子这就是它和“普通 pair spread”最不一样的地方。
论文第 4 节把价格按 βi1 缩放:
p*i,t = p_i,t / β_i1
这样处理后,每个缩放价格都可以写成:
f1βi2 / βi1 决定暴露的第二因子 f2于是任意两资产的 scaled spread:
翻成人话: 不是直接做原始 price spread,而是先 strip 掉共同市场 beta,再做 residual spread fade。
这条思路比“相关高 → pair → z-score”更像一个真正能扩展成 basket stat-arb 的壳。
论文的单步逻辑其实挺直接:
f2;论文给的例子(Table 5)里,排序后策略动作是:
所以它不是一条固定 pair,而是: 共同趋势剥离后的 rank-based 多腿 mean reversion / stat-arb。
OpenAlex 摘要和正文都指向同一个结论:
1 integrated + 1 stationary factor2 integrated factors论文正文还写得很直白:
two common integrated factors这对 desk 很重要: 第二因子是不是还 stationary,本身就是 admission layer,而不是事后解释。
Table 6 给了不同 no-trade 常数 c 下的 summary:
c = 0.20(作者认为更合理,兼顾费用后更优)时:
222G_{τ+M} mean:7623.34G*_{τ+M} mean(含 0.10% 交易费):3032.97G*_{τ+M} st.dev.:2598.39文中还明确说:
c=0 时 cumulative gain 最大c=0.20 更像合理选择所以这篇东西不是纯理论文章;它至少给了一条:
都比较完整的原始壳。
表面上它也在做 market-neutral / spread fade,容易被误判成“和已有 pairs digest 差不多”。
但我觉得它真正新增的点有 3 个:
很多 pairs / basket stat-arb 文章默认:
而这篇更像:
这比“裸 spread mean reversion”更接近 factor-neutral stat-arb。
原文虽然最后落到多腿 long-short,但底层不是固定 pair, 而是整个篮子的因子结构。
这对当前 desk 的价值在于:
这篇东西最能落到 desk 的一句其实不是“trade spread”,而是: 当第二因子不再 stationary,就停。
这比很多 pairs repo 里的固定 z-score / 固定半衰期规则更干净。
15m因为论文原始是日频 + Bayesian dynamic factor / state-space 估计, 我先做一个最小 desk proxy,看它有没有 short-cycle 素材价值:
BTCUSDT / ETHUSDT / LTCUSDT / SOLUSDTXMR 在当前 Binance 永续不可直接照搬,所以我用 SOL 做可交易替代,重点保留“共同 market factor + 次级 residual factor”这个结构,而不是硬复刻原资产集合15m2025-11-12 08:00 UTC 到 2026-04-11 07:45 UTC10d rollingcommon trendresidual factor4 / 8 / 12 bars产物:
reports/artifacts/literature/dynamic_factor_shortcycle_probe_2026-04-11.csvreports/artifacts/literature/dynamic_factor_shortcycle_probe_2026-04-11.json如果用 10d 训练、half-life 上限 200 bars 的宽松 proxy:
13,43685.84%z >= 1.0 时信号数:5,432但问题是:
4-bar 持有 gross mean 只有 +1.06 bps/trade8-bar 持有 gross mean +2.02 bps/trade12-bar 持有 gross mean +2.59 bps/trade也就是说: 共同趋势剥离后的第二因子 fade,在 15m 上不是完全失效,但 naive trade 太薄,直接 taker 化基本不行。
把 entry 提高到更极端的 |z| >= 1.75:
1,7084-bar gross mean:+2.01 bps/trade8-bar gross mean:+3.67 bps/trade12-bar gross mean:+5.07 bps/trade12-bar win rate:56.8%这说明什么?
20 bps round-trip 成本假设,它还是过不了。所以我对这轮 probe 的结论是: 它是“可独立复现的 raw alpha 候选”,但还不是“当前 desk 可直接拿来完整部署的 finished strategy”。
在可交易窗口中位数上:
0.3670.5380.4020.577+0.154+0.451-0.457-0.249翻成人话:
更像是: short 第二因子偏热的一侧,long 第二因子偏冷的一侧。
虽然论文原始框架是完整的, 但对我们当前 5m/15m short-cycle desk,我认为更诚实的定位是:
主题类型:raw alpha是否可独立复现:是是否可直接落地完整策略:否原因不是 base alpha 不清楚; 恰恰相反,base alpha 很清楚。
真正的问题在于:
我们最近 pairs / stat-arb 积累已经很多, 但大多还是:
这篇新增的是: 共同趋势先 strip,再做第二因子 residual 的 market-neutral mean reversion。
也就是把 raw alpha 从“pair spread 回归”再往上抬了一层: 从 spread 工程,变成common-trend neutralized factor-residual stat-arb。
这条线值得继续挖。
我建议下一轮不要再做“大而全重写论文”,而是直接做这 4 个最小实验:
当前 probe 用的是 rolling PCA proxy。 下一步应补一个更接近论文原意的版本:
f1、f2f2 的 stationarity / half-life先回答: PCA 的第二主成分,能不能稳定近似论文里的第二因子?
当前结果已经说明:
因此下一步应把 alpha 限制到:
|z_f2| >= 1.75 或 2.08~12 bar 这一档zero-cross / half-z / time-stop 做离场比较如果继续做 4-leg basket:
所以下一步必须显式比较:
不然这条线永远只会停留在 paper alpha。
下一步应该试两类 universe:
BTC / ETH / LTC / SOL / XRPETH / LTC / SOL / XRP / ADA看哪个更容易形成:
如果 alt-heavy 版本能把共同 market beta 外显得更干净, 它在 15m 上可能反而比 BTC-inclusive 更像可交易对象。
这篇 2021 dynamic-factor 论文,不是又一篇可以直接塞进“普通 cointegration pairs”抽屉里的旧材料。
对当前 desk,最值得拿出来单独测的,不是“原文那套日频 long-short 排名”本身, 而是它背后的这条 raw alpha:
先剥共同趋势,再做第二因子 residual basket fade。
这是条:
的 raw alpha 候选。
所以我会把它放在当前研究池里的定位定为: “值得继续做 exact-factor replication 与 maker-execution 细化的 factor-neutral basket stat-arb 支线”,而不是立刻上 production 的完成品。