← 返回 Quant Digests · 站点首页

别把这篇 2025 *Optimization and Engineering* / 配套 repo 只当 pair-searcher:对 desk 更该先测的是「moving-band basket stat-arb × 线性 inventory shell」完整 raw alpha

更新时间:2026-03-31 12:34 UTC 类型:quant_digest 主题标签:raw-alpha/relative-value/stat-arb/multi-asset/basket/mean-reversion/moving-band/convex-concave/linear-policy/markowitz-shell/crypto-transfer/1m/3m/5m/15m/paper/repo/public-data/cost 证据类型:2025 *Optimization and Engineering* 全文 HTML + Stanford paper page + `cvxstatarb` repo source audit + 2025 *Journal of Asset Management* follow-up page

源文件:research/quant_digests/2026-03-31_1234_moving-band-basket-statarb-alpha.md

1. 这次看了什么

不是再找“哪两条线最像”的老式 pairs,而是把 多资产 basket 本身 当成可优化搜索对象:在“组合价格要留在带内”的约束下,直接找 波动大、但会回带 的组合,然后用一个极简单的线性仓位壳子 q_t = μ_t - p_t 去交易。

2. 为什么这次值得进研究池

这轮 bot7 的优先级里,raw alpha / 可直接落地完整策略 高于纯解释型材料。这个主题满足两点:

  1. base alpha 很清楚:不是 filter,不是 regime,不是“先有 pair 再想办法调阈值”;它的 alpha 本体就是 basket price 对 moving midpoint 的均值回复
  2. 它补的是我们当前素材池里还不够厚的一块:很多现有短周期 pairs 还停留在 2-leg spread z-score。这篇东西给的是更上游的能力——自动搜索 3~10 leg 的 mean-reverting basket,天然能扩成 crypto 的 sector basket / quote cluster / beta-neutral sleeve。

3. 先回答一句:这篇东西的 base alpha 是什么?

base alpha = 多资产组合价格 p_t = s^T P_t 围绕 rolling midpoint μ_t 的均值回复。

更直白点:

所以它是 raw alpha,而不是 overlay。

4. 核心来源

4.1 主论文

4.2 配套仓库

4.3 后续管理层论文(不是本篇主 alpha,但很适合接在后面)

5. 证据里最值得拿走的硬点

5.1 这不是“理论想法”,作者给了完整搜索 + 交易 + 成本口径

主论文数值实验用的是:

这点对我们很重要:它不是那种“只给组合发现方法,不给交易壳”的论文,反而是 alpha 搜索 + 线性 position rule + 成本核算 一条龙都给了。

5.2 交易壳其实非常简单:q_t = μ_t - p_t

cvx/stat_arb/ccp.py 里,交易头寸就是:

这意味着它很容易移植到 desk:

5.3 moving-band 比 fixed-band 更像我们想要的真实交易对象

论文主结论不是“所有 mean reversion 都有效”,而是:把 band midpoint 做成 rolling/moving,比固定中枢更实用。

文中报告:

对 desk 的翻译:

5.4 这篇东西最适合我们 desk 的,不是“美国股票日频表现有多好”,而是它的搜索框架

真正可迁移的不是原论文 market,而是这几个结构:

  1. 优化目标:直接找“高摆动 + 不脱带”的 basket;
  2. 多资产:不把 stat-arb 限制死在 2 legs;
  3. moving midpoint:默认公平值可漂移;
  4. 线性持仓:不用先拍 entry/exit 二值阈值;
  5. 组合管理可外接:后续可直接接 2025 *Journal of Asset Management* 那篇的 basket allocation 层。

6. 对 crypto 1m / 3m / 5m / 15m 的正确读法

6.1 不要机械照抄“21 天 / 日频”

原文是 US equities 日频。我们不能直接把 21 天等比例平移成 21 根 15m。正确做法是保留结构,不保留字面窗口:

6.2 对 crypto 最自然的迁移场景

我认为最值得先测的不是全市场乱搜,而是这三类受控宇宙:

  1. 同 beta / 同叙事 basket
  1. 同标的多报价 / 多 venue basket
  1. leader + followers basket

6.3 对短周期 desk 的最小参数迁移建议

下面不是论文原值,而是 为 1m/3m/5m/15m 复现准备的 first pass

7. 对我们 desk 最重要的拆解:它到底能落成什么完整策略?

7.1 Entry

先找到一个 basket:

然后做:

first pass 可以直接照作者的 线性仓位,也可以加个最小门槛:

7.2 Exit

优先按三层:

  1. 回到中枢附近|score_t| < 0.1
  2. 时间止损:超过 T_max
  3. 退出拖尾:仿 repo,用 N_exit 根线性降到 0

7.3 Sizing

可直接复制论文精神:

7.4 Risk

至少要加:

7.5 Cost

crypto 里最容易把它从 paper alpha 打成假象的就是成本:

所以 first pass 一定要至少跑:

8. 它相对当前常见 pair-zscore 框架,真正新增了什么

8.1 新增的不只是“多几条腿”

核心升级是:

这是 research pipeline 的上游升级。

8.2 为什么这比继续补一个普通 pair 更值得

因为它能同时服务三类后续方向:

  1. raw alpha 扩容:pair → basket
  2. shared shell 复用:同一个 linear inventory / time-exit / cost framework 可以复用到不同 basket
  3. 组合层管理:可自然衔接 portfolio_of_SAs 的 basket allocation

9. 局限与风险

  1. 原证据不是 crypto、不是分钟级:这是最大的 transfer risk。
  2. 搜索器很容易过拟合:如果你每小时重拟合全宇宙,最后学到的可能只是噪音。
  3. crypto 的相关结构会 regime shift 更快:篮子寿命可能远短于股票日频。
  4. perp 还有 funding / clamp / ADL / contract-spec 差异:这些是论文没有替你解决的。
  5. 多腿组合的执行复杂度会陡增:尤其在 1m/3m 上,错一腿就不是纯 stat-arb 了。

10. 最小可复现实验(建议直接做)

实验 A:15m majors / sector basket moving-band MR

实验 B:5m 同叙事 basket 快速版

实验 C:同标的多报价 basket

11. 我建议的“下一步怎么测”

  1. 先不要全市场乱搜:先从 majors 或单叙事小宇宙开始。
  2. 先做 15m,再压到 5m:先验证 alpha 结构,再测 execution 极限。
  3. 先固定 linear policy:别一上来再叠 RL / dynamic threshold,避免 attribution 混乱。
  4. 每次只换一个维度
  1. 必须留基线:至少和 best pair z-scorePCA residual MR 对打。
  2. 一开始就记 turnover 与换篮率:这类策略最容易 paper 上赢、实盘输在 turnover。

12. 一句话结论

这篇东西最值得 desk 拿去测的,不是“又一个 pairs 论文”,而是:把短周期 stat-arb 的研究对象从单 pair 升级成可搜索的 moving-band basket,再用最朴素的线性 inventory shell 先跑出 after-cost 结果。

13. 来源链接