← 返回 Quant Digests · 站点首页

别把 BTC/ETH pairs 继续写成“信号对了就行”:这份 2026 GitHub 仓库更该先测的是「cointegration spread × beta-consistent sizing」完整 raw alpha

更新时间:2026-03-29 20:55 UTC 研究时间:2026-03-29 20:58 UTC 类型:2026 GitHub 新仓库 + README/source pipeline 审阅 + Binance USDⓈ-M Perpetual 公共 `1h/15m` sizing transfer check 主题标签:raw-alpha/pairs/stat-arb/relative-value/mean-reversion/cointegration/beta-neutral/sizing/hedge-ratio/btc/eth/binance/perpetual/1h/15m/5m/1m/3m/repo/public-data/cost/funding 证据类型:GitHub README/source 规则级证据 + Binance 公共 OHLCV 本地 transfer check + 15m 参数网格稳定性复核

源文件:research/quant_digests/2026-03-29_2058_btc-eth-beta-neutral-sizing-alpha.md

1. 这次看了什么

先把 base alpha 说清楚:

> 这次不是 filter,不是 overlay,也不是“又一份 pairs 教程”。alpha 本体就是 BTC/ETH 的 cointegration spread mean reversion。

翻成人话:

这份 2026 新 repo 最值得 intake 的点,不是“BTC/ETH 能不能做 pairs”——这个市场早就知道了;真正更适合我们 desk 的,是它把一个常被当成细枝末节的东西单独做成了 受控实验

> 同一条 spread alpha,只改 position sizing:从 dollar-neutral 改成 beta-neutral,整条策略的最终 PnL 可以直接翻正。

对短周期 desk 来说,这个分支很值钱,因为它回答的是一个更底层的问题:

> 如果你的 alpha 定义里用的是 β,但仓位还在按 1:1 美元对冲,那你到底是在交易原始 alpha,还是在交易一条被自己 sizing 改坏了的假 spread?

一句话结论先放前面:

> 这条 raw alpha 值得继续留在素材池,但最先该搬的不是“再证明一次 pair 会回归”,而是把“hedge-ratio-consistent sizing”升级成 pairs / stat-arb 的默认必测组件。

2. 核心结论

2.1 这份 repo 真正新增了什么

repo 作者是 Howard (Cheng-Hao) Hsu,项目标题是 Statistical Arbitrage: BTC/ETH Cointegration Pairs Trading Strategy。它不是只给一个 notebook 图,而是把完整管线拆成了:

也就是说,这不是“有信号、没 execution”的半成品,而是一份可以直接拆 entry / exit / sizing / risk / cost 的完整 skeleton。

2.2 repo 里最该记住的数字

作者用的是 Binance USD-M perpetual 的 BTC/USDT 与 ETH/USDT 1 小时数据

统计层面:

先看信号稀疏度:

但真正重要的是 sizing 对照:

Version A:Dollar-Neutral(两腿都固定 5000 美元)

Version B:Beta-Neutral(ETH 腿按 5000 × β_entry 配)

repo 自己给出的解释非常直接:

2.3 最值得 desk 记住的判断

> 这份 repo 最该 intake 的不是“BTC/ETH pairs 可以做”本身,而是“错误 sizing 会把原本还算合理的 pairs alpha 直接做坏”。

3. 为什么和当前项目直接相关

先回答最关键的问题:

> 为什么这篇东西比继续补一个新的 headline alpha 还值得?

因为我们当前库里并不缺:

更缺的是:

> 当 alpha 真的要从 notebook 走向 live 时,signal 定义和 position sizing 有没有保持同一种“统计中性”?

这点和当前 desk 非常直接相关:

  1. 它仍然是 raw alpha,不是纯风控。
  1. 它又不仅仅是“再来一条 pair”。
  1. 它能直接扩到 15m / 5m / 1m
  1. 它对现有素材池是增量,不是重复。

3.5 策略拆解(必填)

4. repo 里的完整机制,翻成 desk 语言

4.1 spread 是怎么定义的

repo 用的是:

Spread_t = log(BTC_t) - β_t × log(ETH_t)

其中 β_t 不是常数,而是 rolling OLS hedge ratio,并且显式 shift(1),避免把当根 bar 信息偷偷用进来。

这意味着:

4.2 入场 / 出场规则

repo 的状态机很规整:

换句话说,这不是“极端就赌回归”的裸奔版本,而是:

4.3 这份 repo 最值钱的地方:sizing 和 signal 定义一致

repo 的关键 insight 可以压成一句话:

> 你定义的是 BTC - β·ETH 这条 spread,就该配 1 : β 这组仓位;否则 signal 和仓位不是同一件东西。

这件事看起来像理论洁癖,实际上是 PnL 大事:

  1. 对冲结构更接近 signal 本身;
  2. ETH 腿 notional 更小,费用更低。

5. Binance 公共 1h / 15m sizing transfer check

我补了一个 轻量本地 transfer check,目标不是复刻 repo 全部统计检验,而是验证最核心的 desk 问题:

> 同一条 BTC/ETH spread mean reversion,只改 sizing,beta-neutral 在当前 Binance 短周期上是不是普遍更优?

5.1 本地 proxy 口径

为保证这轮 intake 速度,我用的是轻量版 proxy,而不是完整 repo 复刻:

也就是说: > 这轮 proxy 只是在测 sizing 迁移,不是在给 BTC/ETH 现成 live verdict。

相关 artifact:

5.2 1h proxy 结果:beta-neutral 明显减损,但还没把 alpha 救活

样本:

结果:

翻成人话:

5.3 15m proxy 结果:短周期上 beta-neutral 也更优,但单靠 sizing 仍救不活

样本:

结果:

这里最该记的不是“依然亏钱”,而是:

> 在 15m 上,beta-neutral 仍然把同一组 trades 的净损失缩小了约 313 bps,同时把 hit rate 提高了约 4.1 pct

也就是说:

5.4 15m 小网格:这不是单点调参巧合

我又扫了一个小参数网格:

总共 81 个 cells,结果:

所以更诚实的结论是:

> beta-neutral 更像“该做的正确实现”,不是“自动把 BTC/ETH 15m pairs 做成赚钱策略”的魔法开关。

6. 这组结果该怎么读

6.1 正面结论:sizing 不是 garnish,是 alpha body 的一部分

如果 signal 依赖 rolling β,那 sizing 不该被降级成回测尾声才看的“仓位细节”。

对 pairs / stat-arb desk 来说,更正确的表述应该是:

> position sizing 不是 signal 后处理,而是 spread 定义的一部分。

6.2 负面结论:当前 Binance 短周期上,BTC/ETH 单 pair 还不够强

这轮 proxy 同时告诉我们另一件更重要的事:

也就是说,下一步不该是“直接上线 beta-neutral BTC/ETH pairs”,而是:

  1. 先把 sizing consistency 变成 pairs 默认标准件;
  2. 再把 alpha 强度问题交给 pair selection / regime gate / execution 来解决。

6.3 对我们当前素材池的直接启发

这张卡最适合服务的,不只是 BTC/ETH 本身,而是整类:

凡是 signal 里出现 β / hedge ratio / factor loading 的策略,都应该补一句:

> 回测里到底是在按 signal 定义配仓,还是在按“习惯上的 1:1 dollars”配仓?

7. 下一步怎么测

7.1 最小可落地实验(优先级最高)

先做一张非常明确的 A/B/C 实验卡:

  1. dollar-neutral
  2. beta-neutral
  3. beta-neutral + vol target

核心验收条件不是“是否赚钱”,而是:

7.2 再往前一步:别只测 BTC/ETH

如果只盯 BTC/ETH,很容易把这件事读成“一个 pair 的特例”。

下一轮更应该扩成 liquid-major pair basket:

用统一框架比较:

最后做一个排序:

> 哪些 pair 是“signal 一般,但 sizing 改对后能显著改善”;哪些 pair 则是“signal 本身就不够,改 sizing 也救不了”。

7.3 真正适配 desk 的增强项

如果这条线继续往 1m / 3m / 5m / 15m 迁移,我会优先加这三层:

  1. regime gate
  1. execution gate
  1. pair governance

8. 来源与可复现性

8.1 主来源(repo)

  1. Howard (Cheng-Hao) Hsu (2026), *Statistical Arbitrage: BTC/ETH Cointegration Pairs Trading Strategy*

8.2 理论地基

  1. Gatev, E.; Goetzmann, W. N.; Rouwenhorst, K. G. (2006), *Pairs Trading: Performance of a Relative-Value Arbitrage Rule*, *Review of Financial Studies*
  1. Ramos-Requena, J. P.; Trinidad-Segovia, J. E.; Sánchez-Granero, M. A. (2020), *An Alternative Approach to Measure Co-Movement between Two Time Series*, *Mathematics*

8.3 本轮本地数据口径

9. 一句话收尾

> 这轮 intake 最值得带走的,不是“BTC/ETH pairs 能做”,而是:凡是 spread 定义里用了 β,就别再把 beta-neutral sizing 当可有可无的小修饰。它应该是 raw alpha 骨架的一部分。