源文件:research/quant_digests/2026-04-23_0248_walkforward-cointegration-basket-alpha.md
看的是 2026 GitHub 仓库 sujith-kamme/statistical-arbitrage-crypto。它不是只做“找一对 cointegration 然后 z-score 开平仓”,而是把 Johansen basket 发现、OU alpha、两层 regime filter、bucket/hysteresis 仓位、inverse-vol risk parity、walk-forward 训练/测试切分 串成了一条完整研究流水线。
23 币日频池里筛到 18 币、做 2~4 资产 basket、365d train + 60d test walk-forward、最终 held-out ~220d 上 gross Sharpe 1.95 / net Sharpe 1.76 / 累计 +5.61% / MDD -1.38% / 仅 9 笔 round-trip;样本不大,但链条完整。15m/5m,rolling pair version):15m 的 BNB/DOGE 在 14 笔下约 +46.37 bps/笔 net、累计 +6.49%;5m 的 ADA/LINK 在 11 笔下约 +11.72 bps/笔 net、累计 +1.29%。说明这条 raw alpha 在短周期上 不是天然死路。这正好补的是当前 desk 很需要的一块:可直接落地的 stat-arb 完整策略壳。相比之前很多“pair spread fade”只给 entry/exit,这个仓库多给了 4 个更能复用的组件:
研究假设:在 crypto 15m/5m 上,稳定 cointegrated pair/basket 的 spread 偏离仍会回归,但只应在“关系没坏掉”的 regime 内做。
最小定义:
BTC/ETH/SOL/BNB/XRP/ADA/DOGE/LINK 上滚动筛 coint p < 0.1 且 ADF p < 0.1 的 pair;z > 2 做空 spread,z < -2 做多 spread,|z| < 0.5 或过零平仓;short-vol / long-vol > 4 时禁止新开仓;8 bps。最小回测切口:
15m 为主、5m 做加速版;2000~3000 bars 滚动;DOGE 在多个 pair 中都显得更活跃,可能既代表更厚的 alpha,也代表更高的执行/滑点风险;上实盘前必须补 maker/taker 分层和容量检查。https://github.com/sujith-kamme/statistical-arbitrage-cryptohttps://raw.githubusercontent.com/sujith-kamme/statistical-arbitrage-crypto/main/readme.mdhttps://raw.githubusercontent.com/sujith-kamme/statistical-arbitrage-crypto/main/labs/research.ipynbreports/artifacts/literature/walkforward_pairs_portability_probe_2026-04-23.csv下一步不要继续围绕单个 pair 手调阈值,应该直接做一个 desk 版最小 basket engine:
2~3 资产 basket;30d / 45d 重估一次 cointegration 权重;ADF breakdown + vol spike 做成统一 veto;15m 上先比较 固定 1 对 vs top-3 diversified baskets 的 net trade expectancy;5m/3m,但必须同步加 maker-first / max-hold / turnover 约束。