← 返回 Quant Digests · 站点首页

别把这篇 2026 deep-learning pairs 论文只读成 DNN/LSTM 比赛:对 short-cycle desk,更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条 pairs raw alpha

更新时间:2026-04-02 03:07 UTC 研究时间:2026-04-02 03:06 UTC 类型:2026 *Frontiers in Applied Mathematics and Statistics* 论文全文摘要 + 2026 GitHub repo source audit(`README.md` + `crypto_pairs.py` + GitHub API metadata) 主题标签:raw-alpha/pairs/stat-arb/relative-value/cointegration/dynamic-johansen/mean-reversion/percentile-threshold/zero-cross-exit/hedge-ratio-smoothing/cost/5m/15m/repo/paper/public-data 证据类型:paper+repo(alpha 命题 + 最小可复现工程壳)

源文件:research/quant_digests/2026-04-02_0306_dynamic-coint-percentile-pairs-alpha.md

1. 这次看了什么

这轮最值得 intake 的,不是“DNN 比 LSTM 更强吗”这种模型比赛,而是这篇 2026 论文和复现 repo 其实已经把一条 完整可落地的 pairs raw alpha 骨架 讲清楚了:

  1. 先用 rolling Johansen 持续重估几条大币之间的长期均衡关系;
  2. 把当前价差压成一个 dynamic spread / dynamic score
  3. 当分数掉到历史低分位就做多、冲到高分位就做空;
  4. 不是下一根就反手,而是等它 回到 0 附近再退出
  5. 再用 hedge-ratio smoothing + transaction cost 控制换手。

所以这轮更该写进研究池的,不是“深度学习预测价差”这件外壳,而是:

> dynamic co-integration spread 的均值回复,本身就是一条完整 raw alpha;DNN/LSTM 只是可选增强层,不是 alpha 本体。

这很适合当前 desk,因为最近 intake 里 directional / lead-lag / microstructure 卡已经不少,但 带有明确 entry / exit / sizing / cost 壳子的 market-neutral pairs raw alpha 还值得继续补齐。

2. 先回答一句:这篇东西的 base alpha 是什么?

base alpha 很清楚:协整价差均值回复。

不是:

真正的 alpha 是:

翻成人话: 模型只是帮你更早看见“偏离有多大”,但赚钱来源还是“偏离会回去”。

3. 为什么这轮值得写,而不是继续补一个 generic ML repo

最近学习进展里,raw alpha 池已经补了不少:

但这篇材料仍然值得写,原因是它补的是另一块:

  1. 它是 raw alpha,不是 filter。
  1. 它自带完整交易壳。
  1. 它比 headline 里的 DNN/LSTM 更 desk-friendly。
  1. 它补的是 market-neutral 素材池。

如果要问:它为什么比继续补一张纯 directional raw alpha 更值得? 答案是: 因为它直接补上了一条可独立复现、可 market-neutral 落地、并且显式处理换手与退出的完整策略母板。

3.5 策略拆解(必填)

4. 这次看的主来源

4.1 alpha 主来源(paper)

  1. Tsoku, J. T.; Makatjane, K. (2026)
  2. Title: *Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs* Venue: *Frontiers in Applied Mathematics and Statistics* DOI: 10.3389/fams.2026.1749337 Readable URL: https://www.frontiersin.org/journals/applied-mathematics-and-statistics/articles/10.3389/fams.2026.1749337/full Repo URL: N/A

4.2 engineering / replication 来源(repo)

  1. M-man2591 (2026), *deep-learning-crypto-pairs-trading*
  2. Venue: GitHub repository DOI: N/A Readable URL / Repo URL: https://github.com/M-man2591/deep-learning-crypto-pairs-trading GitHub metadata: created 2026-02-09T19:36:40Z, pushed 2026-02-10T14:38:25Z 实际看的文件: README.md, crypto_pairs.py

5. 这条 alpha 到底有什么硬信息,不是空想

5.1 论文真正提供的核心,不是“神经网络很强”,而是“协整关系要动态重估”

论文全文最关键的意思有三层:

这三层里,对 desk 最值钱的是第一层和第二层: 市场关系会变,所以 spread 也要动态重估;偏离够大才交易。

5.2 repo 给了更有用的可复现细节

这份 repo 虽然是 MVP recreation,不是论文官方代码,但它把最关键的工程参数写得很实:

这几条对 short-cycle desk 很重要,因为它们已经把“均值回复策略最容易死的地方”先暴露出来了: 不是信号定义,而是换手、退出、以及向前看偏差。

5.3 repo 里的量化结果,哪些能带走,哪些不能硬信

repo README 里给了几组可参考数字:

这些数字我会分成两类看:

  1. 可吸收的
  1. 不能直接照抄的

所以,Sharpe 2.94 不能当 short-cycle desk 的可实现结果,但它足够证明这条骨架值得进复现池。

6. 对当前 desk,更值得偷的不是 DNN/LSTM,而是这条“诚实版 pairs 骨架”

如果把这篇材料 desk 化,第一版根本不用先上深度模型。

更合理的顺序是:

  1. 先保留 raw alpha 本体:
  1. 再保留两个最重要的工程修正:
  1. 最后才看要不要加预测层:

换句话说: 先证明 spread 自己会回,再去讨论“谁预测得更早”。

7. 这条 raw alpha 可以怎样直接落地成完整策略

7.1 Entry

BTC/ETHETH/BNBBTC/ETH/BNB/SOL 这类高流动组合:

7.2 Exit

第一版就照 repo 里最值钱的那条:

7.3 Sizing

7.4 Risk / Cost

至少要加:

  1. fee ladder:round-trip 先跑 2 / 4 / 6 / 8 bps
  2. funding veto:若两腿 funding 差突然极端,避免把 carry 噪音误判成均值回复
  3. liquidity gate:盘口太薄或滑点超阈值时不做
  4. vector smoothing:Johansen / hedge ratio 不要每根 bar 生跳
  5. relationship-break veto:rolling ADF / Johansen / half-life 破线就停做

8. 这条 alpha 与 1m / 3m / 5m / 15m 的关系

8.1 15m

这是最该先测的主战场。 原因:

8.2 5m

可以做第二站:

8.3 1m / 3m

不建议把这条命题直接伪装成 1m 主信号。 更合理的是:

9. 最小可复现实验(直接对当前 desk)

实验 A:先去掉深度学习,只测 raw spread 是否活着

实验 B:vector smoothing ablation

同样信号,只比较:

  1. 原始 rolling hedge vector
  2. EWMA-smoothed vector

这一步只回答一句: 换手下降多少,净值改善多少?

实验 C:entry / exit honesty check

比较三种退出:

  1. 反向阈值退出
  2. zero-cross exit
  3. zero-cross + time stop(如 8~1615m

这一步要回答: repo 里最值钱的改动——state-machine exit——在 crypto perp 上是否仍然成立?

实验 D:5m child execution

15m pair-score 定方向,只在 5m 上执行:

10. 这条线最容易犯的错

11. 为什么它值得进研究池

这张卡值得进池,不是因为“又一个深度学习 repo”,而是因为它把一条 pairs / stat-arb raw alpha 需要的关键零件摆全了:

对当前 desk,它的价值在于: 别急着复现论文 headline 里的 DNN/LSTM;真正该先搬的是“dynamic spread 本体 + honest exit + turnover control”这块完整 raw alpha 骨架。

12. 下一步怎么测

  1. 先做 BTC/ETH 双腿 15m 版,只保留 dynamic spread + percentile entry + zero-cross exit。
  2. 第二步立刻做成本梯度2 / 4 / 6 / 8 bps,不先跑复杂模型。
  3. 第三步只测一个工程点: hedge vector smoothing 是否真的能显著降 turnover。
  4. 若 15m 版 after-cost 仍有边,再扩成 BTC/ETH/BNB/SOL 多资产 spread。
  5. 最后才比较 forecast layer:线性模型 vs LSTM;如果 forecast 没带来更高净边,就停在更简单的 raw spread 版本。

13. 一句话结论

如果只带走一句话,我会带走这句:

别把这篇 2026 pairs paper 只读成 DNN/LSTM 竞赛;对 short-cycle crypto desk,更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条可独立复现、可直接落地的 pairs raw alpha。