源文件:research/quant_digests/2026-04-21_1438_dynamic-johansen-forecast-spread-alpha.md
README.md + crypto_pairs.py)+ Binance USDⓈ-M public-data portability probe(15m/5m)dynamic cointegration spread mean reversion —— 先用 rolling Johansen 找会回归的多币 spread,再用 forecasted dynamic score 的极端分位做反向入场这次主看 Tsoku, J. T., & Makatjane, K. (2026) 的论文 _Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs_(*Frontiers in Applied Mathematics and Statistics*,DOI 10.3389/fams.2026.1749337),以及对应的最小复现仓 M-man2591/deep-learning-crypto-pairs-trading。
先把最关键的问题答清楚:
> 这篇东西的 base alpha 是什么?
答案不是“LSTM 预测价格”,而是:
> base alpha = 动态协整 spread 会向均衡回归;forecast 模块只是决定“这次偏离值不值得做、该不该现在做”。
所以它首先是 raw alpha,其次才是 ML 增强的 timing 壳。
BTC/ETH/LTC/XRP 四腿 basket)显示:15m:45d、14d formation、96-bar z-score 下,10/90 分位入场共 6 笔,gross signal hit rate ≈ 47.1%,cum net ≈ -1.50%;说明把日频论文直接压成 15m,信号过于粘滞,gross 都还没站稳。5m:20d、7d formation、180-bar z-score 下,10/90 分位入场 4 笔,cum net ≈ -0.57%;但若改成更稀疏的 5/95 strongest-only admission,gross cum ≈ +0.18%,扣 8 bps round-trip 后转成 net ≈ -0.22%。它和 desk 当前主线的关系很直接:
entry / exit / turnover / threshold / cost;一句话核心结论:
> dynamic cointegration spread 这条 raw alpha 在 5m/15m 不是不能移植,但不能直接照搬“预测极端分位就一路拿到 zero-cross”这套慢节奏执行。
一句话证明方式:
> 论文给了方法、repo 给了最小实现,我再用 Binance 公共 15m/5m 数据做了 desk-friendly 快检,结果是 forecast 侧看着顺,但 post-cost 侧还不够。
dynamic cointegration spread mean reversion研究假设:对 liquid-perp basket,dynamic Johansen spread 的 forecast-percentile fade 在 5m/15m 仍有 gross edge,但需要比论文更短的持有和更严的入场。
一个可计算定义:
BTC/ETH/LTC/XRP 或更广 liquid basket;spread -> rolling z-score;30 个 score 预测 next score;5/95 或更极端分位时开仓;zero-cross exit vs time-stop(4/8/12 bars);4 / 8 / 12 bps。最该先看:
post-cost expectancy / tradeactive bar share(别让信号长期黏在仓位里)15m 比 5m 更差,提示这条壳压到 intraday 后未必是“越慢越稳”,反而可能是越慢越拖、越容易被持仓成本和 regime 漂移侵蚀。10.3389/fams.2026.1749337https://www.frontiersin.org/journals/applied-mathematics-and-statistics/articles/10.3389/fams.2026.1749337/fullhttps://github.com/M-man2591/deep-learning-crypto-pairs-tradingREADME.md, crypto_pairs.py/root/clawd/jerry/momentum/reports/artifacts/quant_digests/2026-04-21_dlcointegration_probe_15m.json/root/clawd/jerry/momentum/reports/artifacts/quant_digests/2026-04-21_dlcointegration_probe_5m.json/root/clawd/jerry/momentum/reports/artifacts/quant_digests/2026-04-21_dlcointegration_thresholdscan_15m.csv/root/clawd/jerry/momentum/reports/artifacts/quant_digests/2026-04-21_dlcointegration_thresholdscan_5m.csv先别急着换更复杂模型,先做 3 个最便宜的 A/B:
10/90 vs 5/95 admission —— 先把持仓黏性压下来;zero-cross exit vs 4/8/12-bar time-stop —— 验证是不是“等太久”把 gross edge 耗掉;single-best basket vs all-eligible baskets —— 看这条壳更像 router 还是 portfolio engine。如果这三步后 5m 能在 8 bps 以内保住正的 post-cost expectancy,它才值得进入更正式的 short-cycle stat-arb replication 池。