← 返回 Quant Digests · 站点首页

别把短周期 pairs 继续写成固定 σ 阈值:这篇 2025 LUT thesis 更该先测的是「percentile-entry × cointegration spread MR」完整 raw alpha

更新时间:2026-03-30 18:58 UTC 类型:2025 LUT thesis 全文 PDF + 本地全文抽取 + 表格级结果复核 主题标签:raw-alpha/pairs/stat-arb/relative-value/mean-reversion/cointegration/percentile-threshold/threshold-governance/binance/usdt/3m/5m/15m/paper/public-data/cost 证据类型:全文证据(thesis)+ 表格级结果复核 + desk 化迁移

源文件:research/quant_digests/2026-03-30_1858_percentile-entry-cointegration-pairs-alpha.md

1. 这次看了什么

主看这篇:

  1. Micke Metsälä (2025). _Pairs trading performance in cryptocurrency markets_. Bachelor’s thesis, LUT University.

先把 base alpha 说清楚:

> 这次主角不是 filter,不是 regime,也不是“pairs 研究综述”。真正的 raw alpha 是:筛出 cointegrated pair 后,spread 偏到尾部就做均值回归,而且 minute crypto spread 更适合用 percentile 触发,而不是照抄 ±2σ。

这轮我没有把 2026 的 *Pairs Trading in Crypto*(Stoikov et al.)当主 digest,不是因为主题不强,而是当前可稳定拿到的主要是 Crossref 摘要;反过来,这篇 2025 LUT thesis 虽然不是顶刊,但全文可读、样本口径完整、3m/5m/15m 直接贴 desk、entry/exit/sizing/cost 都写清楚,对本轮 intake 更有用。

一句话核心结论:

> 在 short-cycle crypto pairs 里,真正值得先复现的不是“distance vs cointegration”这个老问题本身,而是“cointegration + percentile-entry + mean-cross exit”这条完整策略骨架。

一句话它是怎么证明的:

> 作者用 Binance 378 个可做空 USDT 资产、71253 个 pair、200 天 formation + 200 天 trading、并把 10bps 交易成本直接扣进回测,逐个比较 3m/5m/15m 下的 distance 与 cointegration。

2. 核心结论

先给结论,不绕:

这篇东西最值钱的不是“pairs 在 crypto 里也能赚钱”这么泛,而是下面四点:

  1. 它给的是完整策略,不是只有入场信号。
  1. 对 crypto minute spread,percentile 阈值比 ±2σ 更像可用模板。
  2. 论文明确解释:crypto pair spread 往往偏斜、重尾,直接拿标准差做阈值,可能会让某些 pair 几乎没机会,或把极端值当常态。作者改成:

  1. cointegration 在 3m / 5m / 15m 都比 distance 更稳。
  2. 全样本汇总:

  1. 对 desk 最有用的不是照搬“哪些 pair 最赚钱”,而是照搬“怎么选 pair、怎么定阈值、怎么核算成本”。
  2. 论文里很多优胜 pair 带有明显 2024 小币风格(例如 REZ/OMNI/RVN/KMD/DYM 一类),这部分不能原样照抄进实盘;但它的策略骨架很适合拿来做 liquid-perp universe 的最小复现。

3. 为什么和当前项目直接相关

这轮选它,是因为它满足当前 bot7 的高优先级标准:

  1. raw alpha 很清楚。
  2. 不是“pairs 可以当 filter”,而是spread 尾部回归本身就是可交易的 alpha。

  1. 它是完整策略,不是半成品。
  2. 现在素材池里有很多 pairs / relative-value 主题,但并不是每篇都把 entry / exit / sizing / cost 一起讲透。这个材料恰好给了完整 skeleton。

  1. 时间框架正好贴着 desk。
  2. 它直接跑的是 3m / 5m / 15m,不是日频论文硬迁移。

  1. 它补的是一个很具体的缺口:threshold governance。
  2. 我们最近 intake 了不少 pairs / same-underlier / basket stat-arb,但“spread 用什么阈值触发更诚实”这个问题,还没有被单独钉牢。这里给了一个非常适合最小实验的答案: 固定 σ 阈值未必好,percentile 阈值更稳。

需要诚实补一句:

这并不削弱它的价值,反而告诉我们下一步该测什么: alpha 是否主要集中在入场后的前 1~3 天,能否把多天持有压缩成更 desk-friendly 的持仓上限。

3.5 策略拆解(必填)

4. 论文里真正值得复现的部分

4.1 数据与实验口径

论文样本并不花哨,但非常适合复现:

对当前 desk 来说,这个口径最大的优点是: 不需要稀缺外部数据,直接用公开 K 线 + 可做空清单就能开第一轮。

4.2 pair selection 怎么做

作者不是随手挑几对币,而是:

翻成人话就是:

这也是为什么它更适合做 raw alpha 主体,而不只是辅助过滤层。

4.3 最值得抄的不是 headline,而是阈值设计

论文第 3.7 节其实比 headline 更值钱。

作者明确反对机械照搬 ±2σ entry + 0-cross exit,理由很简单:

对 desk 而言,这个分支想法的价值甚至高于“cointegration 比 distance 强”这个 headline:

> 因为 distance/cointegration 只是 pair selection,percentile-entry 才直接决定信号触发密度、胜率结构和成本后存活率。

5. 关键实证结果

5.1 按频率看:cointegration 全部胜出,15m 收益最高,5m Sharpe 最好

论文 Table 9 / Table 10 最值得先记住的是这几组数字:

#### Cointegration

#### Distance

这组结果翻成人话:

5.2 Top pair 结果给了两个提醒

cointegration 侧:

distance 侧也有不错个例,比如:

但这里最该学的不是“RVN/KMD 很神”或“REZ/PHA 很神”,而是两个提醒:

  1. 小币 pair 容易好看,但实盘可承载性很可疑。
  2. 太接近的 wrapper pair 反而可能几乎没肉。
  3. 文中多次提到:

这对 desk 很关键: > 最稳的 pair 不一定最值钱;太“完美锚定”的 pair,往往只剩薄 spread,成本后没边。

6. desk 化后的最小实验

这篇最适合直接变成一个 4 叉对照实验,而不是写完就放进 archive:

6.1 先做最小 universe

第一轮别上 378 个小币,先做:

6.2 直接做 2 × 2 对照

对每个频率 3m / 5m / 15m,跑四个版本:

  1. distance + ±2σ / 0-cross
  2. distance + percentile / mean-cross
  3. cointegration + ±2σ / 0-cross
  4. cointegration + percentile / mean-cross

这样第一轮就能回答最关键的问题: 真正有用的是 cointegration,还是 percentile-entry,还是两者必须一起出现?

6.3 先把持有期压缩测试掉

论文平均持有 12~17 天,和 desk 目标不完全一致。 所以必须额外加:

如果利润大多在前 1~3 天已经实现,那它就 still 值得进 short-cycle 素材池; 如果必须长时间占资才有肉,那就降级成中短周期 stat-arb,而不是当前主线优先。

6.4 成本口径不要只扣 taker fee

论文只扣了 10bps,但 desk 版至少还要补:

7. 这轮最值得带走的结论

如果只留一句:

> 这篇材料最该进入素材池的,不是“crypto pairs 也能做”这种大结论,而是:在 3m/5m/15m 的 crypto pairs 里,先用 cointegration 选 pair,再用 percentile-entry / mean-cross 管 spread,比机械 ±2σ 更像当前 desk 应该优先复现的完整 raw alpha。

8. 下一步怎么测

按优先级直接排:

  1. 先在 liquid universe 复刻论文骨架
  1. 先回答“阈值问题”,再回答“pair 问题”
  1. 加持仓上限,检查 alpha 衰减前沿
  1. 加 friction ladder
  1. 最后再决定它在 desk 里的角色

9. 来源

  1. Metsälä, M. (2025). _Pairs trading performance in cryptocurrency markets_. LUT University Bachelor’s thesis.
  1. Stoikov, S., Xu, D., Shao, S., Wang, Y., Zhang, T., Hu, J. (2026). _Pairs Trading in Crypto_. SSRN.