← 返回 Quant Digests · 站点首页

别把这份 2026 Hyperliquid stat-arb repo 直接当完整交易系统:对 short-cycle desk,更该先测的是「bucket dispersion MR × funding-divergence admission」这条 raw alpha

更新时间:2026-04-12 23:43 UTC 研究时间:2026-04-12 23:56 UTC 类型:quant_digest 主题标签:raw-alpha/stat-arb/cross-sectional/relative-value/mean-reversion/bucket-dispersion/funding/funding-divergence/gate/hyperliquid/5m/1h/repo/public-data/cost/risk 证据类型:2026 GitHub repo source audit(`README.md` + `configs/default.yaml` + `configs/strategy_stat_arb.yaml` + `src/hyperstat/strategy/stat_arb.py` + `src/hyperstat/strategy/funding_divergence_signal.py` + `src/hyperstat/strategy/regime.py` + `src/hyperstat/strategy/allocator.py` + `src/hyperstat/backtest/engine.py` + `src/hyperstat/backtest/costs.py`)+ repo bundled public-data probe(`data/candles/*/5m.parquet` + `data/funding/*/8h.parquet`)

源文件:research/quant_digests/2026-04-12_2356_hyperstat-fds-gated-bucket-mr-alpha.md

1. 这次看了什么

主材料(repo)

这轮最值得 intake 的,不是把 repo 整体照抄成“又一个完整 stat-arb 系统”,而是先把它拆开成两层:

  1. alpha 本体5m 频率下、看过去 12 bars = 1h 的 bucket 内 cross-sectional mean reversion;
  2. 过滤层:funding-divergence signal(FDS)只在资金费率和价格错位时给 alpha 放行或加权。

也就是说,这轮真正值得 desk 先测的不是: > “repo 里整套配置能不能直接搬上线?”

而是: > “bucket dispersion MR 这条 raw alpha 单独站不站得住?以及 funding divergence 能不能把一堆垃圾反转信号筛掉?”

2. 先回答一句:这篇东西的 base alpha 是什么?

很清楚:

> base alpha = bucket 内过去 1 小时相对强弱偏离过大后的 cross-sectional mean reversion。

翻成人话:

funding 在这里不是主信号,只是:

所以本轮主题归类应是:

3. repo 到底怎么写这条 alpha

3.1 stat_arb.py:核心信号其实很朴素

repo 的 StatArbStrategy 并不神秘,本体就是:

也就是: > 过去 1h 明显相对偏离的币,按 contrarian 方向做 fade。

这是标准的 raw alpha 骨架,而且是可直接复现的,不靠私有数据,不靠模型黑箱。

3.2 allocator.py / regime.py:真正复杂的是“怎么别把它做烂”

repo 真正费力写的不是 alpha 本体,而是:

这恰恰说明一个现实:

> 这条 alpha 的难点不在“有没有想法”,而在“怎样把换手和拥挤过滤掉”。

3.3 funding_divergence_signal.py:repo 里最值钱的旁支

FDS 不是简单看 funding 高低,而是揉了三件事:

repo 把它设计成:

这很符合 desk 用法,因为它回答的是: > 哪些 MR 偏离更像 crowding 失衡,哪些只是趋势里你去逆着接飞刀。

4. 最小 public-data probe:先看“原始 alpha”,再看“FDS 是否有用”

这次我没有停在源码阅读,而是直接用 repo 自带公开数据做最小实验:

4.1 数据口径

为什么这口径是合格的:

5. 结果一:repo 默认整套 stat-arb 在自带数据上,先被成本吃掉

我先按 repo 默认参数跑了一轮最小回测(BTC + ETH/SOL/AVAX/ARB/OP,bucket MR + neutralization + funding overlay/FDS + repo 默认成本):

5.1 默认成本配置

5.2 回测摘要

这组数的核心意思很简单:

> raw idea 不是完全没回归味道,但默认做法的 gross 基本打平,净值则被换手成本狠狠干穿。

所以这题不能老实巴交写成“可直接落地完整策略”,那样是在骗自己。

6. 结果二:bucket dispersion 本身会压缩,但“怎么分配腿”才是胜负手

我把 alpha 本体拆出来,不走整套 backtest engine,而是直接看 bucket 内结构是否在未来 1h 有压缩:

6.1 bucket spread 压缩证据

定义:

结果:

翻成人话:

> bucket dispersion 会压缩,这件事是真的。

但问题也正出在这里:

7. 结果三:vanilla 单做 MR 事件不行,但 FDS 过滤后的 pocket 变得像样

接着我只看真正会触发交易的事件:

7.1 不加 FDS,原始 MR 事件是负的

在 funding 可对齐的样本里:

也就是说: > vanilla bucket MR 在这个 pocket 里并不够好。

7.2 一旦用 FDS 做 admission,质量明显改善

我把 repo 的 FDS 思路做成最小 batch gate,对 active MR 事件按 gate score 做筛选:

#### 当加权 FDS 分数 > 0

#### 当加权 FDS 分数 > 0.25

从单腿事件角度再看也类似:

这组数最关键:

> 不是“funding 自己就是 alpha”,而是“funding divergence 能把原本质量很差的 MR pocket 筛成勉强像样的 pocket”。

8. 这题该怎么落在我们研究池里

8.1 正确标签

我会把这题标成:

不是:

8.2 它对 desk 真正的价值

这题最值钱的不是“repo 已经写好了回测引擎”,而是它给了一个更适合 desk 的拆法:

  1. 先承认 bucket MR 本体很脆
  2. 再用 crowding / funding 错位去筛 pocket
  3. 最后只做最值得做的几次,不要整本书一直滚。

这比直接抄 full-book stat-arb,更接近真钱研究。

9. 与 1m / 3m / 5m / 15m 的关系

5m

这是本题当前最自然的第一落点:

3m / 1m

可以做,但不是马上压过去:

15m

更像控制组或低频版:

10. 下一步怎么测

这里必须很具体,不然这篇 digest 只有阅读价值,没有研发价值。

10.1 第一优先:别再做 whole-book,改做 sparse book

直接测这三版:

  1. top1 rich / top1 cheap only
  2. top2 / bottom2 only
  3. 只保留 FDS > 0.1 / 0.25 的 event

目标:

10.2 第二优先:把持有逻辑从“迟钝 hysteresis”改成“clock exit + compression exit”

当前 repo 是:

下一步该测:

10.3 第三优先:把成本分成 maker / taker 两张账

当前 repo 默认成本对 short-cycle 太狠,下一步必须拆开:

因为这题现在最像的是: > gross edge 只在精选 pocket 上存在,能不能活下来主要看是否能把执行从“持续滚动 taker”改成“低频 + 更偏 maker”。

10.4 第四优先:跨 venue 可移植性

若后续想从 repo bundled 数据走向更通用研究,先复现到:

11. 一句话结论

这题最后我会给一个很明确的结论:

> hyperstat-arb-bot 里真正该 intake 的,不是“默认 full-book stat-arb”,而是“bucket dispersion MR 这条 raw alpha + funding-divergence admission 这层过滤”。

更直接一点:

12. 文件与来源