← 返回 Quant Digests · 站点首页

别把这份 2026 新 repo 只读成 XGBoost infra:对 short-cycle desk,更该先测的是「top-N XS loser-bounce × pump-dump veto × confidence sizing」这条完整 mean reversion raw alpha

更新时间:2026-04-02 16:27 UTC 研究时间:2026-04-02 16:25 UTC 类型:raw alpha 主题标签:raw-alpha/cross-sectional/mean-reversion/top-n/loser-bounce/pump-dump-veto/confidence-sizing/binance-perpetual/5m/15m/1h/repo/public-data/cost 证据类型:2026 GitHub 新 repo source audit(`README.md`)+ Binance USDⓈ-M `15` 币公共 `5m` 本地 transfer check

源文件:research/quant_digests/2026-04-02_1625_topn-reversal-pumpveto-confidence-alpha.md

1) 这次看了什么

这轮不再继续把新 intake 写成单一 breakout / retest / 单币 OFI 小变体,而是补一个 更像“完整横截面策略骨架” 的新 repo:

> 短窗横截面反转(reversal / loser-bounce)本身是 base alpha;XGBoost 只是排序器,pump-dump veto 与 confidence sizing 才是让它更接近可交易策略的关键配件。

所以这篇不打算复刻 repo 全量工程,而是把它压缩成 desk 现在就能做的研究题:

> 能不能先用公开 OHLCV 做一个 ML-lite 版 reversal score × top-N concentration × pump-dump veto,验证这条 raw alpha 是否真有独立生命力?

2) 先回答题眼:base alpha 是什么?

Base alpha: 在 crypto 的短周期横截面里,刚刚跌得最狠、且跌法更像“过度出清/超卖”,而不是“操纵性 pump-dump” 的币,未来 15m~1h 更容易出现相对反弹;相对地,刚刚冲得最猛且出现过热特征的币,更容易在横截面上回落。

这意味着:

  1. 要不要只做最极端的 top-N
  2. 要不要把 pump/dump 痕迹踢出去
  3. 仓位要不要跟信号置信度走,而不是一刀切等权。

3) 为什么这条线值得进当前素材池

它符合这轮优先级里的几个关键点:

  1. 它是可独立成立的 raw alpha。
  1. 天然能落成完整策略。
  1. 公开数据可做最小实验。
  1. 和最近 desk 的积累是互补的。
  1. repo 给出的真正价值,不是黑箱模型,而是组件拆解顺序。

4) 从 repo 里真正该拿走的是什么

4.1 repo 的关键事实

根据 repo README:

最值得 desk 听进去的一句话其实不是“XGBoost 很强”,而是:

> “crypto mean-reverts” 这件事,在作者自己的失败复盘里,是从 momentum 主导切到 reversal 主导的核心理由。

4.2 这份 repo 对 desk 的真正启发

对我们来说,这份 repo 的 transferable 部分不是全量 ML infra,而是这四个动作:

  1. 把 alpha 定义成短窗 reversal,而不是继续执着 trend。
  2. 别等权撒网,要做 top-N 集中。
  3. 别把 pump/dump 当成 alpha 本体,要把它当 veto。
  4. 仓位别平均分,至少要有一个简化版 confidence layer。

换句话说,repo 在教我们的不是“怎么堆 72 个特征”,而是:

> 薄 edge 的横截面反转,必须靠“集中、过滤、分层”三件套,才有可能从研究信号变成交易策略。

5) 本地最小 transfer check(公开数据,先测便宜壳)

5.1 数据口径

我先没复刻 repo 的 XGBoost,而是做了一个最便宜的 transfer shell,看看 “横截面短窗反转”本体到底有多厚

5.2 先测最裸的 raw alpha:1h loser/winner 横截面反手

最便宜版本:

结果:

这说明一件事:

> “短窗横截面反转”本体不是 0,但很薄。

5.3 再加一个 repo 风格的 pump-dump veto

我用一个很便宜的 proxy 模仿 repo 的 pump-dump filter:

结果:

结论也很直接:

5.4 成本下的结论:便宜壳还不够

按更现实的成本压力看:

所以这轮最重要的不是“这条线失败了”,而是更精确地知道:

> repo 的 transferable alpha 不是“任何 loser basket 都能赚钱”,而是“必须把 reversal 做成高浓度 top-N + 置信度分层 + manipulative-move veto”的完整策略壳。

这恰好符合当前 desk 的需要:

6) desk 该怎么把它落成完整策略(先做 ML-lite v0)

6.1 Universe

先别上 444 币,先从 20~40 个流动性更稳定的 perpetual 起步:

6.2 Signal:先不用 XGBoost,先做 4 因子 reversal stack

直接用 repo 里最容易 transfer 的 reversal 侧 primitives,先做一个线性分数:

最小版得分:

score = z(rev_1h) + 0.5*z(rev_4h) + 0.5*z(mean_rev_zscore_1h) + oversold_proxy

然后做横截面排序:

6.3 Concentration:别做 15% quantile,先做固定 top-N

这是我觉得这份 repo 最值得先偷的组件之一。

先测:

如果 top-N concentration 有效,应该看到:

6.4 Pump-dump veto:要做得比“单阈值排除”更像 veto

最小版先用三个 cheap proxy:

只要其中两项同时过阈值,就暂时不纳入可交易池。

注意这里的定位:

6.5 Exit

短周期版先别复杂化:

  1. score 翻到另一侧;
  2. alpha 衰减到 0 附近;
  3. 单币 hit intraday stop。

6.6 Sizing

最小版就做一个 confidence-lite

这就已经比等权更像 repo 想表达的东西了:

> 不是所有 reversal 都同等可信。

6.7 Risk / cost

必须明确写进 v0:

7) 这条线和 1m / 3m / 5m / 15m 的关系

这条 alpha 最自然的层级关系是:

也就是说,这条线虽然来自 5m engine repo,但不一定要把 5m 当唯一主信号频率; 更合理的 desk 做法很可能是 15m 选篮子、5m 管持仓、1m/3m 做执行。

8) 这轮真正的判断

如果只问一句“这条东西值不值得进研究池”,我的回答是:值。

但它值得进入研究池的原因不是:

而是因为它很清楚地告诉我们:

  1. 短窗 raw alpha 的 base 是 XS reversal,不是继续硬凹 momentum。
  2. cheap shell 很薄,说明必须做 concentration。
  3. pump/dump 要当 veto,不要当 alpha 本体。
  4. 仓位要跟置信度走,否则薄 edge 很容易被成本吃掉。

这四点都直接服务于当前 desk 的 raw alpha 素材池建设,而不是偏离主线。

9) 下一步怎么测(直接进复现队列)

Step 1:先做 ML-lite 四因子版本

用公开 OHLCV 先还原这四个组件:

不要先上 XGBoost,先看 线性组合 + 横截面排序 能不能把毛 edge 从 <1 bps / basket-hour 拉升到 >8~10 bps 量级。

Step 2:优先扫 top-N × hold,不要先扫大而全模型

先做这个小网格:

核心问题只有一个: > edge 是不是藏在“更集中、更短持有”的 pocket 里?

Step 3:把 pump-dump veto 做成二元 admission,不是软打分

直接比较:

看哪种最能在 不显著压缩胜率的前提下 提高净 bps。

Step 4:做 confidence-lite sizing

至少做两版:

如果分层 sizing 没有改善净值曲线,说明 repo 的“confidence”对 short-cycle transfer 可能没那么重要; 如果改善明显,就说明这条线确实更像“完整策略”,不是单点因子。

10) 来源与链接

主来源(repo)

repo 内直接可转移的关键信息

---

一句话结论: 这份 2026 新 repo 真正值得 desk intake 的,不是全量 XGBoost infra,而是它把一条本来很薄的 XS 短窗反转,拆成了 top-N concentration + pump-dump veto + confidence sizing 的完整策略壳;下一步最该做的,是先用公开 OHLCV 复刻一个 ML-lite 版,看它能不能在 15m/5m 上先活过成本。