← 返回 Quant Digests · 站点首页

别把这篇 2019 crypto stat-arb 论文直接翻译成今天的 liquid-major perp alpha:对 short-cycle desk,更该先测的是「lag-stack RF × 120m 横截面中位数超额」这条 raw alpha——但当前 majors 版本明显不过成本线

更新时间:2026-04-13 13:50 UTC 研究时间:2026-04-13 13:46 UTC 类型:2019 *Journal of Risk and Financial Management* 论文摘要/元数据(OpenAlex + Crossref)+ GitHub repo source audit(`README.md` + `crypto_forest_example.py` + `feature_generator.py` + `crypto_dataprovider.py` + `kpi_backtest.py`)+ Binance USDⓈ-M `5m/15m` public-data portability probe 主题标签:raw-alpha / cross-sectional / relative-value / stat-arb / machine-learning / random-forest / lagged-returns / median-relative-target / 120m / market-neutral / binance-perpetual / 5m / 15m / paper / repo / public-data / cost / risk 证据类型:论文摘要 + 开源代码 + 公共数据 portability probe

源文件:research/quant_digests/2026-04-13_1346_lagstack-rf-xsmedian-statarb.md

1. 这次看了什么

这次主看 Thomas Fischer, Christopher Krauß, Alexander Deinert (2019), _Statistical Arbitrage in Cryptocurrency Markets_,以及作者配套公开的 GitHub 代码仓库。它不是那种“讲一个因子名词就结束”的文章,而是一个很明确的 横截面 market-neutral 预测壳

  1. 用分钟级多尺度滞后收益做特征;
  2. 预测某个币在未来 120min 是否会跑赢当期横截面中位数;
  3. long top-k / short flop-k
  4. 持有 120min 后反手平仓。

这对我们 desk 有价值,因为它补的是 cross-sectional / relative-value / stat-arb 方向,而不是再绕回单币 breakout / retest 内循环。

不过,这篇东西最容易被误读成:

我这轮更关心的是:它的 base alpha 到底是不是今天还能落到 5m/15m desk 上的 raw alpha?

2. 核心结论

3. 为什么和当前项目有关

虽然这轮 portability 结论偏负面,但它对当前项目依然有直接价值:

3.1 它补的是我们明确想补的方向

这不是又一条单币 trend / breakout 线,而是很标准的:

这正好符合这轮 bot7 想主动补的方向。

3.2 它把“alpha 本体”和“执行壳”拆得很清楚

这篇 paper/repo 最有价值的地方,不是“random forest”四个字,而是它把 alpha 主体定义得很干净:

> alpha 本体 = 未来 120min 的横截面相对强弱可由过去多尺度 lag return 预测。

至于:

这些都是 壳层 / 执行层,不是 alpha 定义本身。

3.3 它给了一个很重要的负面筛选结论

当前 liquid-major perp 上,这条线的问题不是“完全没有方向感”,而是:

这意味着它更可能属于:

  1. 更宽 universe 才有用
  2. maker-first / rebate / internal-cross / queue 优势 才有用;
  3. 或者要被降级为 shared rank feature / filter,而不是单独上线的主策略。

这类“不能直接上,但知道为什么不能上”的结论,对素材池同样有价值——至少能避免我们再把时间花在“liquid majors 上照搬论文壳”这条低胜率路线。

3.5 策略拆解(必填)

4. 可复刻的最小实验

4.1 论文最小复刻口径

4.2 我这轮已经做的最小 portability probe

4.3 下一步最该怎么测

这篇东西值得继续测,但不是继续在 10 个 majors 上死磕。最优先是下面 3 步:

  1. 把 universe 扩到 30~50 个 liquid alts
  1. 显式做成本分桶:2 / 4 / 8 / 12bps
  1. 把它降维成 desk 更易落地的 shared rank feature

4.4 这轮最该先看的 2 个指标

  1. post-cost mean bps / rebalance(分费率桶看)
  2. prediction-spread bucket 下的边际改善(判断它到底是“需要强分歧过滤”,还是根本没有 edge)

5. 风险与保留意见

6. 本地 artifacts

7. 来源

  1. Fischer, T., Krauß, C., & Deinert, A. (2019). _Statistical Arbitrage in Cryptocurrency Markets_. Journal of Risk and Financial Management, 12(1), 31.
  1. OpenAlex metadata / abstract reconstruction
  1. Crossref metadata
  1. 配套代码仓库
  1. Binance USDⓈ-M public market data