← 返回 Quant Digests · 站点首页

别把这份 2026 repo 继续读成 breakout:代码里真正活下来的,是「200-bar Donchian overshoot fade × 10bps breach」BTC 15m raw alpha

更新时间:2026-04-01 01:15 UTC 研究时间:2026-04-01 01:13 UTC 类型:2026 GitHub repo `README.md` + `notebooks/04_breakout_strategy.py` + `notebooks/05_breakout_extension.py` + `notebooks/06_pairs_strategy.py` + `notebooks/07_pairs_strategy_vol_filter.py` + `report/tables/*.csv` source audit 主题标签:raw-alpha/single-asset/mean-reversion/donchian/overshoot-fade/high-vol-admission/threshold/btc/binance/15m/5m/3m/1m/repo/public-data/cost 证据类型:仓库源码 + 回测表格 + 失败对照(lead-lag / pairs)

源文件:research/quant_digests/2026-04-01_0113_donchian-overshoot-fade-threshold-alpha.md

1. 这次为什么选它

先回答一句:这篇东西的 base alpha 是什么?

答案很清楚:

> single-asset intraday overextension mean reversion。 > 具体说,就是 BTC 在 15m 上向上/向下显著穿出一个很长的历史区间后,下一段更容易先往区间里回,而不是立刻继续顺着突破方向跑。

它不是 filter,也不是纯执行优化,更不是“看 breakout 名字就默认 trend”。 这份 repo 里最值得 desk 抄的,反而是一条 可独立交易、带完整出入场与成本口径的单币均值回复 raw alpha

更关键的是,它不是拍脑袋挑出来的。repo 自己先测了三条线:

  1. BTC→ETH/DOGE lead-lag:基本没显著性;
  2. BTC–ETH pairs:样本内还能看,样本外被成本打穿;
  3. BTC 单币 Donchian 极端偏离回归:样本外反而还活着。

这很适合当前 desk:不是再补一个共享 filter,而是补一条 原生 15m、公开数据可复现、完整策略骨架清楚 的 raw alpha。

2. 先把 repo 真正在说什么讲明白

主来源:

  1. Sidney Yin (2026)
  2. *COMP0051 Algorithmic Trading Coursework*

repo 表面上把其中一条模块叫作 breakout_strategy,但代码实际上写的是:

也就是:

这不是 trend-following breakout;这是 Donchian overshoot fade

而且 baseline 版本已经带了一个很朴素但有用的 admission:

翻成人话:

> 不是“安静区间的小假突破”去做回归,而是专抓高波动里真正甩出区间的那种 overextension。

3. 这条线为什么比 repo 里其他路线更值得进池

3.1 lead-lag 这条线,在这份 repo 里其实已经被否掉了

conditional_returns.csv 给的 BTC→ETH / BTC→DOGE 条件前瞻收益几乎都不显著:

cross_correlations.csv 也很直白:

也就是说,这个 repo 自己给的证据更像在说: 别再把“BTC 先动、alts 跟随”默认当 15m 可收费 raw alpha。

3.2 pairs 也不是这份 repo 里真正的幸存者

pairs_summary.csv 里只有 BTC–ETH 真正通过 cointegration:

但落到真实交易规则和 5 bps 成本后,pairs_performance.csv 的样本外结果并不好:

说明这份 repo 里,统计上 cointegrated 不等于 短周期交易后还能剩下净边

3.3 真正活下来的,是单币极端偏离回归

repo 的 breakout_extension_comparison.csv 反而给出很清楚的答案:

#### Baseline:200-bar 区间外侧直接反手 + 高波动 admission

#### Test A:在 baseline 上再加 10 bps breach threshold

#### Test B:再进一步改成 20%~80% 中间波动带过滤

这个对 desk 非常重要:

> 最值钱的不是“多加 filter”,而是“极端偏离本身 + 轻量 threshold”。 > 过度精致的 regime band 反而把 alpha 自己掐死了。

4. 我会把它怎么定性

这条线的正确分层应该是:

所以它是 raw alpha 主体清楚、filter 只是辅助 的好题,而不是“一个需要挂靠别的主信号的共享 gate”。

5. 直接抄成 desk 语言:完整策略骨架长什么样

策略定义

Entry

05_breakout_extension.py 里样本外更优的 Test A

也就是:

Exit

source 规则很简单:

第一版 desk 化时,我会保留这个骨架,不急着加太多复杂出场。

Sizing

source 用的是固定 100,000 USD gross notional。

真正落到 desk,建议第一版改成:

Risk / cost

source 的成本模型是:

这点很重要,因为 pairs 那条线正是被成本打穿的。

6. 为什么这条 alpha 对 5m / 3m / 1m 也有研究价值

虽然 repo 原生是 15m,但它对短周期 desk 仍然很实用,因为它回答的是一个更一般的问题:

> 当价格以“足够极端”的方式离开一个慢窗口区间时,下一段到底更像 continuation 还是 snap-back?

这个问题完全可以向下迁移。

迁移到 5m 的两种最小口径

#### A. 保持“时钟长度”不变 把 source 的 15m 配置平移到 5m

这测的是:同样 2 天左右慢窗下,5m 更细粒度执行能不能把均值回复吃得更干净。

#### B. 保持“bar 数”不变 直接在 5m 继续用:

这测的是:更快的 micro-overshoot 有没有自己的独立 alpha。

我会优先先跑 A,再跑 B。因为 A 更像 source faithful transfer,B 更像新 alpha 分支。

7. 这条线最值得 desk 学的,不只是结果,还有“别乱加过滤器”

repo 给了一个很少见但很实用的结论:

这说明当前这条 alpha 更像:

翻成人话就是:

> 别把 entry 做得比 alpha 还聪明。 > 如果市场已经给了你“跑出 200-bar 区间还多走 10 bps”的极端信息,就别再用漂亮但过拟合的 vol band 去替市场做第二层否决。

8. 我对这条线的判断

我会把它放进当前研究池,而且优先级不低,原因有四个:

  1. raw alpha 很清楚:不是 filter、不是解释卡;
  2. 原生就是 15m:和当前 desk 默认频段一致;
  3. 完整策略组件齐全:entry / exit / cost 都可直接抄;
  4. repo 内部已经做了失败对照:lead-lag、pairs 都没它诚实。

如果这轮还要继续补 raw alpha 素材池,我宁愿先补这种: 简单、极端、成本后仍有机会活的单币回归, 而不是再写一个听起来更 fancy 的 shared gate。

9. 下一步怎么测

我建议直接按三阶段跑,别再停在“看起来挺合理”。

Phase A:source-faithful reproduction(先 15m)

第一问只看一件事:5 bps 以上它还活不活。

Phase B:transfer to 5m

跑两组转译:

然后比较:

Phase C:做成可实盘 admission 模块

若 15m/5m 都还能活,再加三层现实化:

  1. funding veto:perp 逆势仓是否被 funding 吃掉;
  2. session split:亚洲/欧洲/美盘哪个时段 snap-back 更强;
  3. maker/taker split:边界外 10 bps 的 alpha,实际还能留多少给执行。

10. 我最想优先验证的 3 个假设

假设 1:真正关键的不是 Donchian 本身,而是“极端穿透”

也就是:

假设 2:这条线在高波动里反而更好,不该过早做双边 vol 剔除

repo 的 Test B 已经给了负面证据。

desk 要验证的,是不是:

假设 3:这条线更适合 BTC 单币,不要急着横向扩到一篮子 alts

因为这份 repo 里:

所以第一轮别贪多,先把 BTC 单币打透。

11. 公开数据与最小复现口径

数据源

  1. Binance public klines
  1. Binance public taker flow / aggTrades(可选)

最小可复现实验口径

12. 来源

  1. Sidney Yin (2026). _COMP0051 Algorithmic Trading Coursework_. GitHub repository.
  1. Source files used in this digest
  1. Binance public market data