源文件:research/quant_digests/2026-03-29_2121_market-factor-neutralized-multipair-statarb.md
> 先回答 base alpha:这是 raw alpha,不是单纯 filter。 真正赚钱的底层不是“stationary 因子这个名词”,而是 把共同市场因子剥离后,对剩余相对价格错位做 market-neutral 多空回归;regime gate 只是附加条件,用来判定这套 raw alpha 何时该关机。
这次主看 Gianna Figá-Talamanca, Sergio Focardi, Marco Patacca (2021) 的开放获取论文 _Common dynamic factors for cryptocurrencies and multiple pair-trading statistical arbitrages_(*Decisions in Economics and Finance*)。它研究 BTC / ETH / LTC / XMR 在 2016-01 到 2019-11 的联合价格结构,不是只做单个 pair spread,而是先估一个两因子动态模型:
f1 = 共同市场因子(近似 BTC 主导的 integrated factor)f2 = 站在共同因子之外、仍可预测的 stationary factor最值钱的可复用点有两个:
β_i1 缩放,让共同市场因子在 pair spread 里相互抵消;entry / no-trade threshold / regime gate / fee 全写出来,并展示这套 market-neutral 策略只在第二因子仍 stationary 时赚钱,失效后应主动停机。更具体地说:
2019-08 前仍是可交易的 stationary 偏离。p_i = α_i + β_i1 f1 + β_i2 f2 + ε_i,再除以 β_i1,这样任意 pair 的 scaled spread 主要只剩 f2 驱动;这一步很适合 desk 化,因为它天然把“全市场一起抽风”从信号里拆出去。2019-08-20 后第二因子不再 stationary,且两个因子相关性升高,于是 2019-09 后基本不再交易。也就是说,这篇 paper 的真正含义不是“alpha 永远存在”,而是 “当共同因子 + 站稳因子这组结构成立时,basket stat-arb 可以开;结构塌了就该关。”2016-01 到 2018-12 的估计窗里,作者得到:λ1 = 0.9962(ADF p=0.27124,接近 unit root)、λ2 = 0.9823(ADF p=0.00564,可视作 stationary),而两因子相关性约 0.005。这说明“市场主趋势”和“可回归偏离”在那段时期是能分开的。β11 = 0.9911,几乎就是市场共振腿;第二因子对 ETH 的加载最强,β22 = 5.2255。对 desk 来说,这很像在告诉我们:先识别共同 beta 腿,再看谁在共同 beta 之外偏得最多。334 天;若完全不设阈值(c=0),交易 252 次,扣 0.10% 费用后的净累计收益均值约 3031.17;设 c=0.20 时交易降到 222 次,但净累计收益均值略升到 3032.97。结论不是“0.20 神奇最优”,而是:这种 raw alpha 天生怕换手,必须把 no-trade band 当正式组件来测。当前 desk 最近已经补了不少:
但还相对少一个素材: > 不是“挑哪一对”而已,而是“怎么把整个 basket 先做 market-mode neutralization,再统一做相对价值排序”。
这篇 paper 的价值就在这里:
1m / 3m / 5m / 15m 的 basket stat-arb / relative-value 主线;entry / veto / threshold / cost 写得足够清楚,适合先做最小实验,再决定要不要继续升级成更复杂的 PCA / Kalman / VECM 版本。corr(f1,f2) 不得过高;第二因子 ADF 不通过时停机;可再加 no-trade threshold c·σ_vβ_i1 做 scale / hedge;top-half short、bottom-half long;测试 c=0/0.1/0.2 的 band;显式计入 maker/taker 成本研究假设: 在 Binance 永续大市值宇宙里,若先剥离共同市场因子,再对剩余 stationary 偏离做 basket 排序,多空 book 会比“直接按原始收益排序”更像可持续的 relative-value raw alpha。
一个可计算定义:
BTC, ETH, SOL, BNB, XRP, DOGE, ADA, LTC 等流动性最高 perp;15m,再向 5m 和 1h 做稳健性对照;45d~60d 滚动;PCA + AR(1) 近似论文里的 dynamic factor);scaled forecast price,每根 bar 把宇宙分成 top-half / bottom-half;p<0.05 且因子相关性低于阈值 时开仓;entry: |g_{t+1} - v_t| > c·σ_v;先测 c ∈ {0, 0.1, 0.2};exit: 先做 下一根平仓、4 bar、16 bar 三档;> 最该先测的 desk 版本: Binance perp 15m + 60d formation + PCA market mode neutralization + ADF/corr gate + c=0/0.1/0.2。如果这版连 gross 都站不住,就别急着上更复杂 Kalman;如果 gross 活、净后死,再重点修 no-trade band 和持有期,而不是先堆模型。
4 个币、日频、2016-2019,对今天 perp 市场肯定不是直接照搬;1m/3m/5m 很容易把微观结构噪音也当成“第二因子”;15m/1h 的中速 stat-arb,而不是超短高速信号;0.10% fee 下还能保住净收益,但 short-cycle perp 若 taker 占比高,结果会迅速塌掉。PCA 近似版,别一上来追求完整 Bayesian dynamic factor。 先验证“market-factor neutralization + basket ranking”这个 raw alpha 核心是否有 transfer。next-bar alpha;至少拆 1 / 4 / 16 bars 三档。2/4/6 bps 和 6/10/14 bps 两组 round-trip 场景。research/quant_digests/2026-03-29_2121_market-factor-neutralized-multipair-statarb.md10.1007/s10203-021-00318-xhttps://doi.org/10.1007/s10203-021-00318-xhttps://link.springer.com/article/10.1007/s10203-021-00318-xhttps://link.springer.com/content/pdf/10.1007/s10203-021-00318-x.pdf未找到论文官方策略仓库(截至 2026-03-29)