← 返回 Quant Digests · 站点首页

别把这份 2026 stat-arb repo 只读成“日频 market-neutral 框架”:对 short-cycle crypto desk,更该先拆的是「cointegration-first pair admission × strongest residual z-score spread fade」这条 raw alpha

更新时间:2026-04-19 01:12 UTC

源文件:research/quant_digests/2026-04-19_0112_cointegration-spreadfade-router-alpha.md

先回答一句:这篇东西的 base alpha 是什么?

base alpha 很清楚:cointegration / residual spread mean reversion

不是“market neutral 很好听”,也不是“相关性高就能做 pairs”,而是:

> 先筛出关系相对稳的 pair,再在残差 z-score 极端时做回归。

所以这轮我没有把 repo 只当成“又一个 stat-arb 大框架”,而是直接把最像 desk 可交易原型的那一层拎出来:

> pair admission 用相关性 + 残差稳定性,entry 用 residual z-score extreme,exit 先看 1h~3h 的 fixed-hold / time-box fade。

---

这次看了什么,为什么值得 intake

来源

我为什么选它

  1. 它不是“pairs trading 概念文”,而是把 pair discovery / hedge ratio / z-score entry-exit / cost / WFO 都写出来了;
  2. 它自己很诚实:repo 公布的日频真实样本 OOS 表现是负的,但 BTC 相关性接近 0,说明骨架不是假 market-neutral;
  3. 对我们 desk 来说,真正值钱的不是把整套日频外壳照抄,而是把里面最硬的那层翻成 15m residual fade router

一句话核心结论:

> 这份 repo 的价值不在“日频 WFO 成绩单”,而在它把 pairs/stat-arb 最该先保留的 raw alpha 骨架写得很干净:先做 pair admission,再做 residual extreme fade。

一句话证明方式:

> 作者用 Engle-Granger pair discovery、rolling hedge ratio、残差 z-score 进出场、显式成本和 walk-forward backtest 来支撑这条线。

---

repo 里最值得记的几个硬点

  1. pair discovery 不是只看相关性。
  2. pairs.py 先相关性预筛,再做 Engle-Granger residual test,并要求 half-life 落在区间内;这比“看到两条线长得像就上”靠谱得多。

  1. signal 层很朴素,但足够可交易。
  2. signals.py 的核心是:

  1. repo 自己的日频真实样本并不漂亮。
  2. results/backtest_results.json 里,作者公开给出的 OOS 结果约是:

  1. 但这恰好更适合我们 desk 的读法。
  2. 既然日频大而全版本不厚,就不要迷恋长样本组合壳;更该回到短周期去测: 极端 residual 偏离后,未来 1h~3h 有没有 pocket mean reversion。

---

本轮 portability probe:更像 15m raw alpha,而不是 5m 硬压执行

Probe 口径

结果 1:当前最像 pocket 的 pair,不在 BTC/ETH,而在 mid-cap 组合

本轮 proxy 里筛出来的 3 组代表性 pair 是:

这和很多短周期 stat-arb 的经验一致:majors 最干净,但也最容易被卷平;mid-cap 某些结构 pocket 反而更厚。

结果 2:15m residual extreme fade 当前是正的,而且越拉长到 2h~3h 越像样

对这些入选 pair,用 residual |z|>=2 作为事件,方向按“偏离就反手回归”处理:

若同一时点多个 pair 同时触发,只做 abs(z) 最大 的 strongest-only router:

也就是说,这条线当前更像:

> 15m pair-admission + strongest residual dislocation router + 2h~3h time-box fade

而不是高频秒杀策略。

结果 3:硬把它压成 5m child execution,当前反而转负

把同样的 15m 事件拿去看 5m 子窗口:

这很关键:不要看见 spread fade 就本能想“越快越好”。 当前更合理的 desk 读法反而是:

---

3.5 策略拆解(必填)

---

为什么这轮值得进研究池

因为它补的是 raw alpha 素材池,不是又一个“shared gate”。

而且它服务的是我们最近持续在补的空缺:

更具体地说,这轮先回答了一个很直接的问题:

> 对 short-cycle crypto desk,pairs/stat-arb 该先押注在哪一层?

当前答案不是“复杂图聚类”也不是“先上 Kalman 全家桶”,而是:

> 先把 pair admissionresidual extreme fade 这条最朴素的 raw alpha 壳测扎实。

---

最小可复刻实验

  1. 10~20 个 liquid perp;
  2. 每天/每周重算一次 pair admission:相关性预筛 + residual stationarity/half-life;
  3. 每根 15m 更新 residual z-score;
  4. |z|>=2,做 beta-neutral spread fade;若多组同时触发,只做 abs(z) 最大的 1 组;
  5. 固定持有 8~1215m,或 |z|<0.5 提前出;
  6. 粗扣双腿 round-trip 成本后,再看这条线是不是还活着。

先看两个指标:

下一步怎么测:

  1. 把本轮 lightweight proxy 升级成正式 Engle-Granger / ADF admission;
  2. 做 friction ladder: 8 / 12 / 16 / 20 bps 的双腿 round-trip 生死线;
  3. 加 break-risk veto: 当 BTC 单边大波动或 funding/event 边界来临时,pair 关系是否更容易断裂;
  4. 做 horse race: 和现有 ratio-zscore pairscluster deviation stat-arbresidual loser-bounce basket 比,确认它是不是独立 pocket。

---

风险与保留意见

  1. 本轮本地 probe 不是 repo 的严格复刻。
  2. repo 有更完整的 Engle-Granger / ADF / WFO / cost 结构;我这轮先做的是 short-cycle portability proxy。

  1. 成本非常关键。
  2. 这是双腿进、双腿出;gross 15~24bps 看着不错,但如果 taker/slippage 合计上到 16~20bps,很多边际样本就会被吃掉。

  1. pair break 是真风险,不是 paper risk。
  2. crypto 里叙事切换、funding、链上事件、上币/下币消息,都会让原本稳定的 pair 突然失效。

  1. 当前 pocket 更偏 mid-cap。
  2. 这意味着 edge 可能更厚,但容量、滑点、冲击成本也会更差。

---

我对这条线的当前判断

这轮我会把它放进:

> 可独立复现、且可直接落成完整策略壳的 raw alpha 候选。

不是因为 repo 的日频成绩单很漂亮,恰恰相反—— 正因为 repo 把骨架写清楚、但原版成绩并不神,我们才更容易老老实实地把它拆成 desk 真正该先测的那一层。

当前最值得保留的,不是“大而全 stat-arb 平台”这件事,而是:

> pair admission × strongest residual dislocation fade15m 上有 pocket evidence,但不适合直接压成 5m 高频执行。

---

来源