← 返回 Quant Digests · 站点首页

别把这份 2026 Hyperliquid 双引擎 repo 只读成“大而全机器人”:对 short-cycle desk,更该先拆的是「cointegration scan × half-life gate × spread z-score fade」这条 pairs raw alpha

更新时间:2026-04-01 18:53 UTC 研究时间:2026-04-01 18:50 UTC 类型:2026 GitHub 新仓库 source audit(`README.md` + `examples/README.md` + `examples/download_data.py` + `tests/test_output.md` + GitHub API metadata) 主题标签:raw-alpha/pairs/stat-arb/relative-value/mean-reversion/cointegration/half-life/adf/hurst/dynamic-hedge-ratio/spread-zscore/hyperliquid/binance/perpetual/1h/15m/5m/3m/1m/repo/public-data/cost/execution 证据类型:GitHub repo README + data-download script + tests summary + GitHub API metadata(repo-based)

源文件:research/quant_digests/2026-04-01_1850_hyperliquid-cointegration-halflife-pairs-alpha.md

1. 这次看了什么

这轮更值得 intake 的,不是 repo 里那个“全自动双引擎 bot”叙事,而是它明明白白暴露出来的一条可单独拆走的 raw alpha:先从 70+ 个 Hyperliquid/币安可映射永续里扫 2400+ 个 pair,筛出 612 个 viable 组合,再只留下 12 个 live candidate;交易层做的不是方向预测,而是 cointegration spread 的均值回复。

最关键的硬数据有三组:

这就足够把主题定性为: 不是“又一个 bot 工程”,而是一条可直接进素材池的 pairs / stat-arb raw alpha blueprint。

2. 先回答一句:这篇东西的 base alpha 是什么?

这轮的 base alpha 很清楚

翻成人话: 两条长期一起走的永续合约短时偏离得太远,就做 long cheap / short rich,赌 spread 收回来。

repo 里真正有研究价值的“旁支”是:

所以这轮应归类为:

3. 为什么这轮值得写,而不是继续找一个更炫的 headline

这轮值得 intake,不是因为 repo 叙事大,而是因为它满足 bot7 当前更高优先级:

  1. base alpha 清楚。 就是 spread MR,不是抽象 overlay。
  2. 可以独立成完整策略。 entry / exit / sizing / risk / cost 都能落下来。
  3. 和 current desk 完全同向。 Hyperliquid / Binance perpetual、1h 扫描、15m/5m 可执行。
  4. 旁支价值高。 即使 repo 不公开精确阈值,它公开的 pair discovery 管线、成本口径和 kill-switch 思路,也足够直接变成我们自己的最小实验。
  5. 它补的是 raw alpha 素材池,而不是再补一个泛 gate。

4. 来源信息

主来源(repo)

方法锚点(repo 明写)

说明:这轮是 repo-based intake,不是某篇已发表 paper 的复刻卡;但它公开的信息已经足够让我们把 pairs sleeve 单独抽出来做 desk 版实验。

5. repo 实际公开了哪些对研究有用的东西

5.1 Universe 和数据管线并不空泛

repo 自带的公开脚本 examples/download_data.py 给了很实用的复现口径:

这点很关键: 它不是嘴上说 pairs,而是把“先在 1h 上扫全市场 pair universe”这个 discovery 步骤写死到了公开脚本里。

5.2 Pair discovery 管线披露得比很多 repo 更完整

README 里 pair sleeve 的公开流程是:

  1. 下载 70+ 个 Hyperliquid-listed perpetuals 的 OHLCV;
  2. 扫描 2400+ pair combinations
  3. ADF 做 cointegration 筛选;
  4. 再用 half-life(回复速度)和 Hurst exponent 继续过滤;
  5. 对 entry / exit 参数做 grid search;
  6. 60/4070/30 walk-forward 验证;
  7. 最后按 OOS Sharpe / profit factor 排名,留下 12 live candidate。

翻成人话: repo 的真贡献,不是“z-score 回归”这四个字,而是把 pair 从 universe discovery → statistical sanity → OOS ranking → live shortlist 的整条流水线讲清楚了。

5.3 交易逻辑虽然没给阈值,但核心骨架已经足够明确

README 明写 pairs engine 是:

这已经把我们最关心的几件事说清:

5.4 成本口径是这轮最值钱的细节之一

README 对 pairs 结果的注释里明确写:

> All results include 0.035% taker fees + 1 bps slippage simulation.

也就是:

这对 desk 的启发非常直接: 5m/1m 上如果你还默认两腿都 taker,这条 alpha 很容易在真实成本下被直接磨死。

6. 3 个最值得记住的硬数据点

  1. Discovery funnel: 2400+ pair combinations → 612 viable → 12 live candidates。
  2. Self-reported pair performance: best pairs 全样本收益 +120% ~ +380%
  3. Self-reported quality + friction: 59% ~ 94% win rate、2.0 ~ 33.5 profit factor,并注明已计入 0.035% taker fee + 1 bp slippage

注意:这些都是 repo 披露值,不是我们独立复核后的本地结果;但足够说明它不是空口说“pairs 有效”。

7. 对 current desk 真正该偷走的是什么

如果把这份 repo 读成“又一个大而全 bot”,你会被工程壳分散注意力。

对 short-cycle desk,真正该偷走的是这条完整策略读法:

  1. raw alpha 本体: cointegrated spread mean reversion;
  2. universe gate: 先全市场扫,再用 ADF / Hurst / half-life 做前置过滤;
  3. entry/exit: 用残差 z-score 做 admission / close;
  4. risk veto: cointegration break / p-value deterioration / max-hold / residual runaway;
  5. execution shell: atomic pairs execution + maker/taker decision + slippage-aware routing。

也就是说,这轮真正值得 intake 的不是“repo 赚了多少”,而是: 它把 pairs raw alpha 从“理论上能做”推进到了“该按什么顺序筛、在哪一层死、该怎样把成本写进去”的工程化 blueprint。

8. 和当前 1m / 3m / 5m / 15m 的关系

8.1 不要把 1h pair discovery 和 5m execution 混成一件事

repo 的公开 discovery 示例是 1h。 这很合理,因为:

对当前 desk 更合理的映射是:

8.2 这条 alpha 更像“慢筛选 + 快执行”,不是 ultra-fast scalp

pairs MR 在 crypto 上常见的误区是:

这份 repo 反而提醒了一条更靠谱的路: 先用更慢的窗把 pair 选干净,再在更快的 bar 上执行。

8.3 第一刀别铺全市场,先从 liquid majors / upper-mid 开始

虽然 repo 扫了 70+ 币,但我们做最小实验没必要第一刀就跟满。 更适合先试的,是:

原因不是“这些最容易赚钱”,而是: 这些合约更有机会同时满足流动性、稳定 beta、较低 legging friction。

9. 可复刻的最小实验

实验 A:weekly pair discovery(最优先)

  1. 先做 rolling correlation 初筛;
  2. 再做 Engle–Granger / ADF;
  3. 只保留 Hurst < 0.5 的 spread;
  4. half-life 只保留在一个可交易区间,例如 2 ~ 48 bars;
  5. 对 rolling OLS / Kalman beta 都留一个分支。

目标不是直接找到最赚钱的 pair,而是先回答: 哪些 pair 在 2026 的 liquid perp universe 里,还配得上被拿去做 15m execution。

实验 B:15m spread z-score raw alpha

这一步要回答的是: after-cost 的 pairs raw alpha 在 15m 上有没有基本生命体征。

实验 C:5m execution refinement

只在实验 B 有生命体征后再下钻:

  1. 双腿都 taker;
  2. 主腿 maker、对冲腿保护性 taker;
  3. maker-first,超时 fallback 到 taker。

实验 D:kill-switch ablation

把 repo 里最值钱的风险层单独拆出来测:

如果 kill switch 不是提升 OOS,而只是让 IS 更好看,就别神化它。

10. 怎样把它落成完整策略(entry / exit / sizing / risk / cost)

10.1 Entry

10.2 Exit

第一轮先用最朴素的三类:

  1. z-score 回到中线附近;
  2. max_hold 到期强平;
  3. cointegration / ADF 条件失效直接 kill。

10.3 Sizing

10.4 Risk

至少加这几层:

  1. cointegration-break kill switch
  2. legging timeout
  3. max residual excursion stop
  4. single-pair DD cap
  5. portfolio heat cap

10.5 Cost

这条线最容易被低估的就是成本:

11. 下一步怎么测

  1. 先做 1h pair discovery,不要先调 5m z-score。 pair 选不干净,后面都白搭。
  2. 先验证 15m after-cost 是否存活。 如果 15m 都不活,别幻想 1m/3m 会更容易救活。
  3. rolling beta 和 static beta 必须并排。 repo 明写 dynamic hedge ratio,这是这轮最值得验的点之一。
  4. kill switch 必须单独 ablation。 不要默认它一定提升净收益,只能先用实验说话。
  5. 把 atomic execution 当成 alpha 生死线来看。 pairs 策略最大的假阳性来源之一,就是回测里假装双腿同时成交。
  6. 优先看 OOS plateau,不追单点最优阈值。 pairs 策略一旦只有一个窄点参数赚钱,实盘大概率会很脆。

12. 这条线最容易错在哪

13. 对当前项目的直接意义

这轮主题值得进池,因为它满足当前 bot7 的主线偏好:

如果要一句话概括: 这份 2026 Hyperliquid repo 最值钱的,不是“大而全交易机器人”叙事,而是它把一条 pairs raw alpha 的实盘化顺序讲清楚了:先筛干净 pair,再做 z-score fade,再把 kill switch 和双腿执行写进同一张策略卡。

14. 来源链接