← 返回 Quant Digests · 站点首页
别把这篇 2026 deep-learning pairs 论文只读成 DNN/LSTM 比赛:对 short-cycle desk,更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条 pairs raw alpha
更新时间:2026-04-02 03:07 UTC
研究时间:2026-04-02 03:06 UTC
类型:2026 *Frontiers in Applied Mathematics and Statistics* 论文全文摘要 + 2026 GitHub repo source audit(`README.md` + `crypto_pairs.py` + GitHub API metadata)
主题标签:raw-alpha/pairs/stat-arb/relative-value/cointegration/dynamic-johansen/mean-reversion/percentile-threshold/zero-cross-exit/hedge-ratio-smoothing/cost/5m/15m/repo/paper/public-data
证据类型:paper+repo(alpha 命题 + 最小可复现工程壳)
源文件:research/quant_digests/2026-04-02_0306_dynamic-coint-percentile-pairs-alpha.md
- 主题类型:raw alpha
- 基础 alpha:协整价差偏离后会向均衡回归;翻成人话,就是“本来该一起走的几条大币关系临时扭开了,先做偏得最离谱的那条,等它回到常态”
- 是否可独立复现:是
- 是否可直接落地完整策略(entry/exit/sizing/risk/cost):是
- 时间:2026-04-02 03:06 UTC
- 类型:2026 *Frontiers in Applied Mathematics and Statistics* 论文全文摘要 + 2026 GitHub repo source audit(
README.md + crypto_pairs.py + GitHub API metadata)
- 主题标签:raw-alpha/pairs/stat-arb/relative-value/cointegration/dynamic-johansen/mean-reversion/percentile-threshold/zero-cross-exit/hedge-ratio-smoothing/cost/5m/15m/repo/paper/public-data
- 证据类型:paper+repo(alpha 命题 + 最小可复现工程壳)
1. 这次看了什么
这轮最值得 intake 的,不是“DNN 比 LSTM 更强吗”这种模型比赛,而是这篇 2026 论文和复现 repo 其实已经把一条 完整可落地的 pairs raw alpha 骨架 讲清楚了:
- 先用 rolling Johansen 持续重估几条大币之间的长期均衡关系;
- 把当前价差压成一个 dynamic spread / dynamic score;
- 当分数掉到历史低分位就做多、冲到高分位就做空;
- 不是下一根就反手,而是等它 回到 0 附近再退出;
- 再用 hedge-ratio smoothing + transaction cost 控制换手。
所以这轮更该写进研究池的,不是“深度学习预测价差”这件外壳,而是:
> dynamic co-integration spread 的均值回复,本身就是一条完整 raw alpha;DNN/LSTM 只是可选增强层,不是 alpha 本体。
这很适合当前 desk,因为最近 intake 里 directional / lead-lag / microstructure 卡已经不少,但 带有明确 entry / exit / sizing / cost 壳子的 market-neutral pairs raw alpha 还值得继续补齐。
2. 先回答一句:这篇东西的 base alpha 是什么?
base alpha 很清楚:协整价差均值回复。
不是:
- “LSTM 预测得更准,所以做多”;
- 也不是“ensemble 权重会自适应,所以它是 alpha”。
真正的 alpha 是:
- 先找到一组在长期上应当共同运动的币;
- 当它们的相对关系短暂偏离均衡时,做 long cheap leg / short rich leg;
- 等偏离回归正常,再平仓。
翻成人话: 模型只是帮你更早看见“偏离有多大”,但赚钱来源还是“偏离会回去”。
3. 为什么这轮值得写,而不是继续补一个 generic ML repo
最近学习进展里,raw alpha 池已经补了不少:
- cross-asset lead-lag
- OFI / taker-flow / microstructure
- XS momentum / XS reversal
- basis / carry / funding dispersion
但这篇材料仍然值得写,原因是它补的是另一块:
- 它是 raw alpha,不是 filter。
- 它自带完整交易壳。
- entry、exit、turnover control、成本、state machine 都明确写了。
- 它比 headline 里的 DNN/LSTM 更 desk-friendly。
- 真正能快速搬到
5m / 15m 的,不是深度网络,而是 dynamic spread × percentile entry × zero-cross exit 这套骨架。
- 它补的是 market-neutral 素材池。
- 对当前 desk,这比再多补一张“单腿追涨/反转”卡更平衡。
如果要问:它为什么比继续补一张纯 directional raw alpha 更值得? 答案是: 因为它直接补上了一条可独立复现、可 market-neutral 落地、并且显式处理换手与退出的完整策略母板。
3.5 策略拆解(必填)
- 方向属性:pairs / relative-value / market-neutral
- 基础 alpha:co-integrated spread mean reversion
- regime:只在协整关系仍稳定、流动性足够、价差未进入结构性破裂时启用
- filter / veto:协整检验失稳、极端新闻 / funding 结算 / spread 扩宽 / volume 真空时停做
- risk / sizing / execution overlay:按 hedge ratio 配腿;按 spread z-score 分层加仓;按 fee ladder 和 vector smoothing 限制换手
4. 这次看的主来源
4.1 alpha 主来源(paper)
- Tsoku, J. T.; Makatjane, K. (2026)
Title: *Deep learning-based pairs trading: real-time forecasting of co-integrated cryptocurrency pairs* Venue: *Frontiers in Applied Mathematics and Statistics* DOI: 10.3389/fams.2026.1749337 Readable URL: https://www.frontiersin.org/journals/applied-mathematics-and-statistics/articles/10.3389/fams.2026.1749337/full Repo URL: N/A
4.2 engineering / replication 来源(repo)
- M-man2591 (2026), *deep-learning-crypto-pairs-trading*
Venue: GitHub repository DOI: N/A Readable URL / Repo URL: https://github.com/M-man2591/deep-learning-crypto-pairs-trading GitHub metadata: created 2026-02-09T19:36:40Z, pushed 2026-02-10T14:38:25Z 实际看的文件: README.md, crypto_pairs.py
5. 这条 alpha 到底有什么硬信息,不是空想
5.1 论文真正提供的核心,不是“神经网络很强”,而是“协整关系要动态重估”
论文全文最关键的意思有三层:
- 不是拿一组固定历史系数死抱到底,而是用 dynamic Johansen co-integration 滚动重估均衡关系;
- 不是只用静态 spread,而是把偏离压成 dynamic score 去做交易;
- 不是固定权重 ensemble,而是让模型权重随着近期误差变动。
这三层里,对 desk 最值钱的是第一层和第二层: 市场关系会变,所以 spread 也要动态重估;偏离够大才交易。
5.2 repo 给了更有用的可复现细节
这份 repo 虽然是 MVP recreation,不是论文官方代码,但它把最关键的工程参数写得很实:
- 样本:
2018-01-02 → 2026-02-01,共 2,952 个日频观测;
- 协整窗口:252 天 rolling Johansen;
- dynamic score 的 z-score 窗口:60 天;
- 深度模型输入窗口:30 天;
- 交易阈值:预测分数的 10th / 90th percentile;
- 退出规则:不是反向信号立刻平,而是 score 回到 0 附近退出;
- 成本:显式扣
TC_COST = 0.01;
- hedge vector 再做一层 EWMA smoothing(span=20),repo 作者写明这样可把 turnover 压掉约 72%。
这几条对 short-cycle desk 很重要,因为它们已经把“均值回复策略最容易死的地方”先暴露出来了: 不是信号定义,而是换手、退出、以及向前看偏差。
5.3 repo 里的量化结果,哪些能带走,哪些不能硬信
repo README 里给了几组可参考数字:
- Johansen Trace Stat = 292.6(显著)
- ADF p-value = 0.041(spread 站稳在可均值回复口径)
- LSTM RMSE = 0.216,显著优于 DNN 的 0.560
- Dynamic Ensemble annualised Sharpe = 2.94(net of TC)
- Hit Rate = 71.0%(active position-days)
这些数字我会分成两类看:
- 可吸收的:
- rolling cointegration + percentile entry + proper exit 这套骨架能跑起来;
- turnover control 对最终结果影响极大。
- 不能直接照抄的:
- repo 用的是 Yahoo 日频 close;
- repo 的资产集合和论文正文并不完全一致;
- P/L 主要在 z-score space 里评估;
- 没有严肃的 slippage / impact 模型。
所以,Sharpe 2.94 不能当 short-cycle desk 的可实现结果,但它足够证明这条骨架值得进复现池。
6. 对当前 desk,更值得偷的不是 DNN/LSTM,而是这条“诚实版 pairs 骨架”
如果把这篇材料 desk 化,第一版根本不用先上深度模型。
更合理的顺序是:
- 先保留 raw alpha 本体:
- rolling dynamic spread
- percentile entry
- zero-cross exit
- 再保留两个最重要的工程修正:
- expanding thresholds(防 look-ahead)
- smoothed hedge vector(降 turnover)
- 最后才看要不要加预测层:
- 先试线性 / ridge / lasso
- 再决定是否值得上 LSTM
换句话说: 先证明 spread 自己会回,再去讨论“谁预测得更早”。
7. 这条 raw alpha 可以怎样直接落地成完整策略
7.1 Entry
对 BTC/ETH、ETH/BNB、BTC/ETH/BNB/SOL 这类高流动组合:
- 每
15m 重算一次 log-price spread;
- 用 rolling Johansen / rolling hedge ratio 得到动态组合权重;
- 把 spread 标准化成 rolling z-score / dynamic score;
- 当 score 跌破扩展样本的
p10:做多 spread(long cheap legs / short rich legs);
- 当 score 冲过
p90:做空 spread。
7.2 Exit
第一版就照 repo 里最值钱的那条:
- long spread:等 score 回到
0 或略高于 0 平仓;
- short spread:等 score 回到
0 或略低于 0 平仓;
- 若协整关系失稳或 funding / spread 成本突然跳升,提前强平。
7.3 Sizing
- 按动态 hedge ratio 配腿;
- gross leverage 先固定,单腿 notional 上限写死;
- 再按 spread 的 rolling vol 反比缩放;
- 若采用多 pair 并行,先做 pair-level risk parity,防止一条高波动 pair 吞掉全组合。
7.4 Risk / Cost
至少要加:
- fee ladder:round-trip 先跑
2 / 4 / 6 / 8 bps
- funding veto:若两腿 funding 差突然极端,避免把 carry 噪音误判成均值回复
- liquidity gate:盘口太薄或滑点超阈值时不做
- vector smoothing:Johansen / hedge ratio 不要每根 bar 生跳
- relationship-break veto:rolling ADF / Johansen / half-life 破线就停做
8. 这条 alpha 与 1m / 3m / 5m / 15m 的关系
8.1 15m
这是最该先测的主战场。 原因:
- 协整 / spread 关系需要一定稳定性;
15m 更容易跨过 fee wall;
- 也更适合动态 hedge ratio 的更新频率。
8.2 5m
可以做第二站:
- 适合把
15m 的 pair-score 细化成更快执行;
- 但容易被换手和 funding / fee 吃掉。
8.3 1m / 3m
不建议把这条命题直接伪装成 1m 主信号。 更合理的是:
- 用
15m pair-score 定方向 / admission;
- 用
1m / 3m 做入场切片、挂单执行、或者 microstructure veto。
9. 最小可复现实验(直接对当前 desk)
实验 A:先去掉深度学习,只测 raw spread 是否活着
- Universe:
BTC, ETH, BNB, SOL 或 BTC, ETH 双腿版
- 数据源:Binance USDⓈ-M perpetual 公共 klines / mark price
- 公开性:公开可得
- 更新频率:1m 原始,聚合到
15m;必要时再降到 5m
- 信号:rolling dynamic spread + expanding percentile threshold
- 出场:zero-cross exit
- 要回答的问题:不加任何 ML,after-cost 的 spread MR 是否还活着?
实验 B:vector smoothing ablation
同样信号,只比较:
- 原始 rolling hedge vector
- EWMA-smoothed vector
这一步只回答一句: 换手下降多少,净值改善多少?
实验 C:entry / exit honesty check
比较三种退出:
- 反向阈值退出
- zero-cross exit
- zero-cross + time stop(如
8~16 根 15m)
这一步要回答: repo 里最值钱的改动——state-machine exit——在 crypto perp 上是否仍然成立?
实验 D:5m child execution
用 15m pair-score 定方向,只在 5m 上执行:
- 看 maker fill 是否足以把成本压下来;
- 若 maker 不行,再判这条 alpha 只适合低频调仓,不适合快进快出。
10. 这条线最容易犯的错
- 错法 1: 把 DNN/LSTM 当 alpha,本末倒置。
- 错法 2: 忽略向前看偏差,用全样本 percentile 直接做阈值。
- 错法 3: 只看入场,不看退出,结果被频繁翻仓吃死。
- 错法 4: 每根 bar 都让 hedge ratio 乱跳,最后 edge 全死在 turnover。
- 错法 5: 把日频论文里的 Sharpe 直接脑补成
5m/15m 可实现 Sharpe。
11. 为什么它值得进研究池
这张卡值得进池,不是因为“又一个深度学习 repo”,而是因为它把一条 pairs / stat-arb raw alpha 需要的关键零件摆全了:
- base alpha 清楚:spread mean reversion
- 交易壳完整:entry / exit / sizing / cost
- 工程修正诚实:no look-ahead、state machine、turnover smoothing
- 可迁移性强:可以先在
15m 快速做最小实验
对当前 desk,它的价值在于: 别急着复现论文 headline 里的 DNN/LSTM;真正该先搬的是“dynamic spread 本体 + honest exit + turnover control”这块完整 raw alpha 骨架。
12. 下一步怎么测
- 先做
BTC/ETH 双腿 15m 版,只保留 dynamic spread + percentile entry + zero-cross exit。
- 第二步立刻做成本梯度:
2 / 4 / 6 / 8 bps,不先跑复杂模型。
- 第三步只测一个工程点: hedge vector smoothing 是否真的能显著降 turnover。
- 若 15m 版 after-cost 仍有边,再扩成
BTC/ETH/BNB/SOL 多资产 spread。
- 最后才比较 forecast layer:线性模型 vs LSTM;如果 forecast 没带来更高净边,就停在更简单的 raw spread 版本。
13. 一句话结论
如果只带走一句话,我会带走这句:
别把这篇 2026 pairs paper 只读成 DNN/LSTM 竞赛;对 short-cycle crypto desk,更该先测的是「dynamic coint spread × expanding percentile threshold × zero-cross exit」这条可独立复现、可直接落地的 pairs raw alpha。