别把这篇 2026 deep-learning pairs 论文只读成 DNN/LSTM 比赛：对 short-cycle desk，更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条 pairs raw alpha

更新时间：2026-04-02 03:07 UTC 研究时间：2026-04-02 03:06 UTC 类型：2026 *Frontiers in Applied Mathematics and Statistics* 论文全文摘要 + 2026 GitHub repo source audit（`README.md` + `crypto_pairs.py` + GitHub API metadata）主题标签：raw-alpha/pairs/stat-arb/relative-value/cointegration/dynamic-johansen/mean-reversion/percentile-threshold/zero-cross-exit/hedge-ratio-smoothing/cost/5m/15m/repo/paper/public-data 证据类型：paper+repo（alpha 命题 + 最小可复现工程壳）

源文件：research/quant_digests/2026-04-02_0306_dynamic-coint-percentile-pairs-alpha.md

主题类型：raw alpha
基础 alpha：协整价差偏离后会向均衡回归；翻成人话，就是“本来该一起走的几条大币关系临时扭开了，先做偏得最离谱的那条，等它回到常态”
是否可独立复现：是
是否可直接落地完整策略（entry/exit/sizing/risk/cost）：是
时间：2026-04-02 03:06 UTC
类型：2026 *Frontiers in Applied Mathematics and Statistics* 论文全文摘要 + 2026 GitHub repo source audit（README.md + crypto_pairs.py + GitHub API metadata）
主题标签：raw-alpha/pairs/stat-arb/relative-value/cointegration/dynamic-johansen/mean-reversion/percentile-threshold/zero-cross-exit/hedge-ratio-smoothing/cost/5m/15m/repo/paper/public-data
证据类型：paper+repo（alpha 命题 + 最小可复现工程壳）

1. 这次看了什么

这轮最值得 intake 的，不是“DNN 比 LSTM 更强吗”这种模型比赛，而是这篇 2026 论文和复现 repo 其实已经把一条 完整可落地的 pairs raw alpha 骨架 讲清楚了：

先用 rolling Johansen 持续重估几条大币之间的长期均衡关系；
把当前价差压成一个 dynamic spread / dynamic score；
当分数掉到历史低分位就做多、冲到高分位就做空；
不是下一根就反手，而是等它 回到 0 附近再退出；
再用 hedge-ratio smoothing + transaction cost 控制换手。

所以这轮更该写进研究池的，不是“深度学习预测价差”这件外壳，而是：

> dynamic co-integration spread 的均值回复，本身就是一条完整 raw alpha；DNN/LSTM 只是可选增强层，不是 alpha 本体。

这很适合当前 desk，因为最近 intake 里 directional / lead-lag / microstructure 卡已经不少，但 带有明确 entry / exit / sizing / cost 壳子的 market-neutral pairs raw alpha 还值得继续补齐。

2. 先回答一句：这篇东西的 base alpha 是什么？

base alpha 很清楚：协整价差均值回复。

不是：

“LSTM 预测得更准，所以做多”；
也不是“ensemble 权重会自适应，所以它是 alpha”。

真正的 alpha 是：

先找到一组在长期上应当共同运动的币；
当它们的相对关系短暂偏离均衡时，做 long cheap leg / short rich leg；
等偏离回归正常，再平仓。

翻成人话： 模型只是帮你更早看见“偏离有多大”，但赚钱来源还是“偏离会回去”。

3. 为什么这轮值得写，而不是继续补一个 generic ML repo

最近学习进展里，raw alpha 池已经补了不少：

cross-asset lead-lag
OFI / taker-flow / microstructure
XS momentum / XS reversal
basis / carry / funding dispersion

但这篇材料仍然值得写，原因是它补的是另一块：

它是 raw alpha，不是 filter。

入场本体就是“协整关系偏离太远”。

它自带完整交易壳。

entry、exit、turnover control、成本、state machine 都明确写了。

它比 headline 里的 DNN/LSTM 更 desk-friendly。

真正能快速搬到 5m / 15m 的，不是深度网络，而是 dynamic spread × percentile entry × zero-cross exit 这套骨架。

它补的是 market-neutral 素材池。

对当前 desk，这比再多补一张“单腿追涨/反转”卡更平衡。

如果要问：它为什么比继续补一张纯 directional raw alpha 更值得？ 答案是： 因为它直接补上了一条可独立复现、可 market-neutral 落地、并且显式处理换手与退出的完整策略母板。

3.5 策略拆解（必填）

方向属性：pairs / relative-value / market-neutral
基础 alpha：co-integrated spread mean reversion
regime：只在协整关系仍稳定、流动性足够、价差未进入结构性破裂时启用
filter / veto：协整检验失稳、极端新闻 / funding 结算 / spread 扩宽 / volume 真空时停做
risk / sizing / execution overlay：按 hedge ratio 配腿；按 spread z-score 分层加仓；按 fee ladder 和 vector smoothing 限制换手

4. 这次看的主来源

4.1 alpha 主来源（paper）

Tsoku, J. T.; Makatjane, K. (2026)

Title: *Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs* Venue: *Frontiers in Applied Mathematics and Statistics* DOI: 10.3389/fams.2026.1749337 Readable URL: https://www.frontiersin.org/journals/applied-mathematics-and-statistics/articles/10.3389/fams.2026.1749337/full Repo URL: N/A

4.2 engineering / replication 来源（repo）

M-man2591 (2026), *deep-learning-crypto-pairs-trading*

Venue: GitHub repository DOI: N/A Readable URL / Repo URL: https://github.com/M-man2591/deep-learning-crypto-pairs-trading GitHub metadata: created 2026-02-09T19:36:40Z, pushed 2026-02-10T14:38:25Z 实际看的文件： README.md, crypto_pairs.py

5. 这条 alpha 到底有什么硬信息，不是空想

5.1 论文真正提供的核心，不是“神经网络很强”，而是“协整关系要动态重估”

论文全文最关键的意思有三层：

不是拿一组固定历史系数死抱到底，而是用 dynamic Johansen co-integration 滚动重估均衡关系；
不是只用静态 spread，而是把偏离压成 dynamic score 去做交易；
不是固定权重 ensemble，而是让模型权重随着近期误差变动。

这三层里，对 desk 最值钱的是第一层和第二层： 市场关系会变，所以 spread 也要动态重估；偏离够大才交易。

5.2 repo 给了更有用的可复现细节

这份 repo 虽然是 MVP recreation，不是论文官方代码，但它把最关键的工程参数写得很实：

样本：2018-01-02 → 2026-02-01，共 2,952 个日频观测；
协整窗口：252 天 rolling Johansen；
dynamic score 的 z-score 窗口：60 天；
深度模型输入窗口：30 天；
交易阈值：预测分数的 10th / 90th percentile；
退出规则：不是反向信号立刻平，而是 score 回到 0 附近退出；
成本：显式扣 TC_COST = 0.01；
hedge vector 再做一层 EWMA smoothing（span=20），repo 作者写明这样可把 turnover 压掉约 72%。

这几条对 short-cycle desk 很重要，因为它们已经把“均值回复策略最容易死的地方”先暴露出来了： 不是信号定义，而是换手、退出、以及向前看偏差。

5.3 repo 里的量化结果，哪些能带走，哪些不能硬信

repo README 里给了几组可参考数字：

Johansen Trace Stat = 292.6（显著）
ADF p-value = 0.041（spread 站稳在可均值回复口径）
LSTM RMSE = 0.216，显著优于 DNN 的 0.560
Dynamic Ensemble annualised Sharpe = 2.94（net of TC）
Hit Rate = 71.0%（active position-days）

这些数字我会分成两类看：

可吸收的：

rolling cointegration + percentile entry + proper exit 这套骨架能跑起来；
turnover control 对最终结果影响极大。

不能直接照抄的：

repo 用的是 Yahoo 日频 close；
repo 的资产集合和论文正文并不完全一致；
P/L 主要在 z-score space 里评估；
没有严肃的 slippage / impact 模型。

所以，Sharpe 2.94 不能当 short-cycle desk 的可实现结果，但它足够证明这条骨架值得进复现池。

6. 对当前 desk，更值得偷的不是 DNN/LSTM，而是这条“诚实版 pairs 骨架”

如果把这篇材料 desk 化，第一版根本不用先上深度模型。

更合理的顺序是：

先保留 raw alpha 本体：

rolling dynamic spread
percentile entry
zero-cross exit

再保留两个最重要的工程修正：

expanding thresholds（防 look-ahead）
smoothed hedge vector（降 turnover）

最后才看要不要加预测层：

先试线性 / ridge / lasso
再决定是否值得上 LSTM

换句话说： 先证明 spread 自己会回，再去讨论“谁预测得更早”。

7. 这条 raw alpha 可以怎样直接落地成完整策略

7.1 Entry

对 BTC/ETH、ETH/BNB、BTC/ETH/BNB/SOL 这类高流动组合：

每 15m 重算一次 log-price spread；
用 rolling Johansen / rolling hedge ratio 得到动态组合权重；
把 spread 标准化成 rolling z-score / dynamic score；
当 score 跌破扩展样本的 p10：做多 spread（long cheap legs / short rich legs）；
当 score 冲过 p90：做空 spread。

7.2 Exit

第一版就照 repo 里最值钱的那条：

long spread：等 score 回到 0 或略高于 0 平仓；
short spread：等 score 回到 0 或略低于 0 平仓；
若协整关系失稳或 funding / spread 成本突然跳升，提前强平。

7.3 Sizing

按动态 hedge ratio 配腿；
gross leverage 先固定，单腿 notional 上限写死；
再按 spread 的 rolling vol 反比缩放；
若采用多 pair 并行，先做 pair-level risk parity，防止一条高波动 pair 吞掉全组合。

7.4 Risk / Cost

至少要加：

fee ladder：round-trip 先跑 2 / 4 / 6 / 8 bps
funding veto：若两腿 funding 差突然极端，避免把 carry 噪音误判成均值回复
liquidity gate：盘口太薄或滑点超阈值时不做
vector smoothing：Johansen / hedge ratio 不要每根 bar 生跳
relationship-break veto：rolling ADF / Johansen / half-life 破线就停做

8. 这条 alpha 与 `1m / 3m / 5m / 15m` 的关系

8.1 `15m`

这是最该先测的主战场。原因：

协整 / spread 关系需要一定稳定性；
15m 更容易跨过 fee wall；
也更适合动态 hedge ratio 的更新频率。

8.2 `5m`

可以做第二站：

适合把 15m 的 pair-score 细化成更快执行；
但容易被换手和 funding / fee 吃掉。

8.3 `1m / 3m`

不建议把这条命题直接伪装成 1m 主信号。更合理的是：

用 15m pair-score 定方向 / admission；
用 1m / 3m 做入场切片、挂单执行、或者 microstructure veto。

9. 最小可复现实验（直接对当前 desk）

实验 A：先去掉深度学习，只测 raw spread 是否活着

Universe：BTC, ETH, BNB, SOL 或 BTC, ETH 双腿版
数据源：Binance USDⓈ-M perpetual 公共 klines / mark price
公开性：公开可得
更新频率：1m 原始，聚合到 15m；必要时再降到 5m
信号：rolling dynamic spread + expanding percentile threshold
出场：zero-cross exit
要回答的问题：不加任何 ML，after-cost 的 spread MR 是否还活着？

实验 B：vector smoothing ablation

同样信号，只比较：

原始 rolling hedge vector
EWMA-smoothed vector

这一步只回答一句： 换手下降多少，净值改善多少？

实验 C：entry / exit honesty check

比较三种退出：

反向阈值退出
zero-cross exit
zero-cross + time stop（如 8~16 根 15m）

这一步要回答： repo 里最值钱的改动——state-machine exit——在 crypto perp 上是否仍然成立？

实验 D：5m child execution

用 15m pair-score 定方向，只在 5m 上执行：

看 maker fill 是否足以把成本压下来；
若 maker 不行，再判这条 alpha 只适合低频调仓，不适合快进快出。

10. 这条线最容易犯的错

错法 1： 把 DNN/LSTM 当 alpha，本末倒置。
错法 2： 忽略向前看偏差，用全样本 percentile 直接做阈值。
错法 3： 只看入场，不看退出，结果被频繁翻仓吃死。
错法 4： 每根 bar 都让 hedge ratio 乱跳，最后 edge 全死在 turnover。
错法 5： 把日频论文里的 Sharpe 直接脑补成 5m/15m 可实现 Sharpe。

11. 为什么它值得进研究池

这张卡值得进池，不是因为“又一个深度学习 repo”，而是因为它把一条 pairs / stat-arb raw alpha 需要的关键零件摆全了：

base alpha 清楚：spread mean reversion
交易壳完整：entry / exit / sizing / cost
工程修正诚实：no look-ahead、state machine、turnover smoothing
可迁移性强：可以先在 15m 快速做最小实验

对当前 desk，它的价值在于： 别急着复现论文 headline 里的 DNN/LSTM；真正该先搬的是“dynamic spread 本体 + honest exit + turnover control”这块完整 raw alpha 骨架。

12. 下一步怎么测

先做 BTC/ETH 双腿 15m 版，只保留 dynamic spread + percentile entry + zero-cross exit。
第二步立刻做成本梯度：2 / 4 / 6 / 8 bps，不先跑复杂模型。
第三步只测一个工程点： hedge vector smoothing 是否真的能显著降 turnover。
若 15m 版 after-cost 仍有边，再扩成 BTC/ETH/BNB/SOL 多资产 spread。
最后才比较 forecast layer：线性模型 vs LSTM；如果 forecast 没带来更高净边，就停在更简单的 raw spread 版本。

13. 一句话结论

如果只带走一句话，我会带走这句：

别把这篇 2026 pairs paper 只读成 DNN/LSTM 竞赛；对 short-cycle crypto desk，更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条可独立复现、可直接落地的 pairs raw alpha。