← 返回 Quant Digests · 站点首页

别把这篇 2026 deep-learning pairs 论文只读成“LSTM 炫技”:对 short-cycle crypto desk,更该先拆的是「dynamic Johansen spread × forecast-percentile fade」这条 raw alpha 壳

更新时间:2026-04-21 14:29 UTC 研究时间:2026-04-21 14:38 UTC 类型:2026 Frontiers 论文全文 audit + 2026 GitHub repo source audit(`README.md` + `crypto_pairs.py`)+ Binance USDⓈ-M public-data portability probe(`15m/5m`) 主题标签:raw-alpha / stat-arb / relative-value / pairs-plus / dynamic-cointegration / johansen / forecast / percentile-entry / mean-reversion / 15m / 5m / paper / repo / public-data / cost / risk 证据类型:论文证据 + 工程实现 + 本地最小可移植性验证

源文件:research/quant_digests/2026-04-21_1438_dynamic-johansen-forecast-spread-alpha.md

1. 这次看了什么

这次主看 Tsoku, J. T., & Makatjane, K. (2026) 的论文 _Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs_(*Frontiers in Applied Mathematics and Statistics*,DOI 10.3389/fams.2026.1749337),以及对应的最小复现仓 M-man2591/deep-learning-crypto-pairs-trading

先把最关键的问题答清楚:

> 这篇东西的 base alpha 是什么?

答案不是“LSTM 预测价格”,而是:

> base alpha = 动态协整 spread 会向均衡回归;forecast 模块只是决定“这次偏离值不值得做、该不该现在做”。

所以它首先是 raw alpha,其次才是 ML 增强的 timing 壳。

2. 核心结论

3. 为什么和当前项目有关

它和 desk 当前主线的关系很直接:

一句话核心结论:

> dynamic cointegration spread 这条 raw alpha 在 5m/15m 不是不能移植,但不能直接照搬“预测极端分位就一路拿到 zero-cross”这套慢节奏执行。

一句话证明方式:

> 论文给了方法、repo 给了最小实现,我再用 Binance 公共 15m/5m 数据做了 desk-friendly 快检,结果是 forecast 侧看着顺,但 post-cost 侧还不够。

3.5 策略拆解(必填)

4. 可复刻的最小实验

研究假设:对 liquid-perp basket,dynamic Johansen spread 的 forecast-percentile fade 在 5m/15m 仍有 gross edge,但需要比论文更短的持有和更严的入场。

一个可计算定义

  1. BTC/ETH/LTC/XRP 或更广 liquid basket;
  2. rolling Johansen 估权重,EWM 平滑;
  3. spread -> rolling z-score
  4. 用最近 30 个 score 预测 next score;
  5. 仅在预测值落到 expanding 5/95 或更极端分位时开仓;
  6. 先比较 zero-cross exit vs time-stop(4/8/12 bars)
  7. friction ladder 至少做 4 / 8 / 12 bps

最该先看

5. 风险与保留意见

6. 来源

  1. Tsoku, J. T., & Makatjane, K. (2026). _Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs_. Frontiers in Applied Mathematics and Statistics.
  1. M-man2591. (2026). _deep-learning-crypto-pairs-trading_. GitHub repository.
  1. Local probe artifacts

7. 下一步怎么测

先别急着换更复杂模型,先做 3 个最便宜的 A/B:

  1. 10/90 vs 5/95 admission —— 先把持仓黏性压下来;
  2. zero-cross exit vs 4/8/12-bar time-stop —— 验证是不是“等太久”把 gross edge 耗掉;
  3. single-best basket vs all-eligible baskets —— 看这条壳更像 router 还是 portfolio engine。

如果这三步后 5m 能在 8 bps 以内保住正的 post-cost expectancy,它才值得进入更正式的 short-cycle stat-arb replication 池。