← 返回 Quant Digests · 站点首页

别把 crypto pairs 继续只做静态 z-score:这份 2026 新 repo 更该先抄的是「5m cointegration pair + graduation + daily throttle」完整 stat-arb 操作系统

更新时间:2026-03-31 11:27 UTC 研究时间:2026-03-31 11:25 UTC 类型:2026 GitHub 新仓库(README + selection / execution / daily guard 核心源码细读) 主题标签:raw-alpha/pairs/stat-arb/relative-value/mean-reversion/cointegration/graduation/risk-overlay/daily-throttle/bybit/perpetual/5m/15m/repo/live-results/cost/execution 证据类型:仓库(README + 4 个核心源码文件 + 自带 execution 导出)

源文件:research/quant_digests/2026-03-31_1125_cointegration-graduation-daily-throttle-statarb.md

1. 这次看了什么

这次不是再补一个“pairs 也能做”的概念卡,而是补一个 能直接拆成 production skeleton 的 2026 repo

最重要的是:这份仓库虽然 不是开箱即跑(缺 DB schema / config / credentials),但它已经把 desk 真正关心的 5 件事写清楚了:

  1. pair 什么时候能进 live 池
  2. entry 到底用什么阈值
  3. 仓位怎么随流动性和 beta 变化
  4. 什么条件平仓
  5. 日内赚了/亏了以后,系统如何自动降速或停机

2. 先回答:这篇东西的 base alpha 是什么?

这篇东西的 base alpha 很清楚

所以它不是单纯 filter,也不是只有风险管理。 核心 alpha 本体就是 cointegration spread mean reversion。

repo 真正有价值的旁支,在于它把这个 raw alpha 外面又包了两层 desk 很缺的可复现组件:

3. 为什么它值得进当前 desk 的研究池

当前池里已经有不少 pairs / stat-arb 题材,但很多还停留在:

这份 repo 的价值恰好在于:

  1. 它仍然是 raw alpha,不是“pairs 旁边的一层 gate”;
  2. 它给的是完整 operating system,而不是单点 feature;
  3. 它天然服务 5m / 15m
  1. 它很适合 desk 做最小实验:先不用追求全自动 pair discovery,先用一个小 pairbook 就能开始跑。

4. repo 里最值得先抄的,不是“cointegration”四个字,而是三层结构

A. Pair 质量层:不是所有 z-score 都配进 live

selection 端先在 5m 上更新 pair 状态:

核心统计门槛来自源码:

这其实已经不是“看到价差大就上”,而是: 只有看起来真的像均值回复 spread 的 pair,才有资格进入 execution 候选池。

B. Graduation 层:pair 要先证明自己最近还能赚钱

SQL-DB-Stat-upd-5.py 里还有一层特别 desk 化的东西:pair level assignment

repo 会基于最近 60d、最多 30 笔交易的统计,把 pair 打成 Level_0 / 1 / 2

这点很关键: repo 不是“组合搜索出 pair 就长期持有信仰”,而是让 pair 先通过最近表现的毕业考试。

对 desk 来说,这比继续空谈“pair selection 最优算法”更值钱,因为它直接给了一个可测 admission layer:

C. Execution / overlay 层:让 alpha 以更像真实 desk 的方式活下来

execution bot 里最有意思的,不是单独某个阈值,而是它把交易写成了完整流程:

  1. 候选选择
  1. entry 触发
  1. sizing
  1. execution
  1. exit

这比“z-score 回到 0 就平”多了一整层真实交易语义。

5. 对短周期 desk,最值得抄的其实是「raw alpha + graduation + daily guard」三段式

如果把它 desk 化,最值得先测的不是“完全 faithful 地重建它的数据库工程”,而是下面这条更小、但仍然忠于仓库精神的版本:

策略骨架

为什么这个版本最适合先做

因为它同时满足四件事:

  1. base alpha 清楚:spread MR
  2. 能独立交易:不是别人的附庸 gate
  3. 能快速实验:公开 K 线即可启动第一版
  4. 能直接接实盘组件:pairbook、sizing、chunk execution、daily risk 全都可落地

6. 我认为 repo 最有价值的“旁支想法”

如果只抄 headline,大家会说: “哦,这不就是 cointegration pair trading 吗?”

但对我们 desk,真正更有价值的其实是 旁支

旁支 1:graduation 比更花哨的 signal 更重要

很多 pair 策略死,不是因为 spread 信号完全没信息,而是因为:

这个 repo 用 60d / max 30 trades 的 recent expectancy 去做升级/降级,给了一个很诚实的 pair rotation 框架:

这很适合直接服务我们后续所有 pairs / stat-arb 线,而不只是这一篇 repo 本身。

旁支 2:日内 profit-lock throttle 很适合 crypto 24/7 desk

daily_guard_2.py 不是只会“亏到某处就停机”。它还做了一个更有意思的东西:

这不等于 alpha 本体,但它非常适合当 shared risk overlay

旁支 3:control leg 用低流动性腿,比“固定等额双边”更 desk 化

仓位这块它不是死板地 1:1 配,而是:

这给了我们一个很现实的 sizing 原则: stat-arb 的容量,应该由更难成交的那条腿决定。

7. 这条线的明显短板

这 repo 不是神谕,明显短板也要写清:

  1. 缺数据库 schema / 配置 / 凭证
  1. live 成绩是作者自报,暂时没有独立审计
  1. pair formation 仍不够透明
  1. 部分参数仍偏经验化

但即便如此,它仍然值钱,因为: 它把“pair alpha 如何活成一个日常可跑系统”这件事写得比大多数论文都具体。

8. 对我们最像最小实验的版本

实验目标

先验证: cointegration spread MR 在 5m / 15m crypto perp 上,是否只有叠 recent-graduation 与 daily-throttle 后,才更像能活的完整策略。

最小实验口径

Universe

Pairbook(第一轮别贪大)

Signal

Entry

Sizing

Exit

Overlay

Cost

9. 我会怎么排优先级

如果只给一次实验预算,我不会先做“全自动 pair discovery + 全自动毕业系统 + 实盘接单”三件套。

我会按下面顺序:

  1. 先测 raw alpha 本体
  1. 再加 graduation
  1. 最后加 daily guard

也就是先回答三个问题:

10. 我的判断

这篇 repo 最该进研究池的,不是因为它证明了“pairs 很强”,而是因为它给了一个很难得的东西:

raw alpha + pair graduation + daily risk governor 的完整可复现骨架。

如果要继续扩 desk 的 raw alpha 素材池 / 实盘组件池,我会给它一个相当高的优先级,因为它同时补了三块:

其中最值得复用到别的线上的,不一定是 z-score 本身,反而是:

11. 下一步怎么测

直接做一个 A/B/C 三层递进实验,不要一步上 production:

  1. A = raw spread MR baseline
  1. B = A + graduation
  1. C = B + daily throttle / stop

第一轮输出至少要有:

如果结果显示:

12. 来源

  1. Anton Velychko (2026). _statistical_arbitrage_trading_system_V1_. GitHub Repository.
  1. Anton Velychko (2026). _README.md_ — live results / architecture / system overview. GitHub Repository file.
  1. Anton Velychko (2026). _selection/SQL-DB-Coint-upd-6.py_ — 5m spread / half-life / ADF / Hurst / z-score update logic. GitHub Repository file.
  1. Anton Velychko (2026). _selection/SQL-DB-Stat-upd-5.py_ — pair graduation / recent expectancy / level assignment logic. GitHub Repository file.
  1. Anton Velychko (2026). _execution/Level_2_CFT_bot_07-12-2025.py_ — candidate selection / dynamic leverage / chunked execution / exit rules. GitHub Repository file.
  1. Anton Velychko (2026). _execution/daily_guard_2.py_ — profit-lock throttle / daily stop overlay. GitHub Repository file.