← 返回 Quant Digests · 站点首页

别把这篇 2024 IJFS 论文只读成“ETH 法币 quote 特例”:对 short-cycle desk,更该先测的是「same-underlier multispread mean reversion × optimizer sizing」完整 raw alpha

更新时间:2026-04-03 03:58 UTC 研究时间:2026-04-03 03:55 UTC 类型:2024 IJFS 开放获取论文全文 + arXiv 预印本全文 + Kraken 公共历史数据口径 主题标签:raw-alpha/relative-value/stat-arb/same-underlier/multispread/mean-reversion/optimizer-sizing/market-neutral/kraken/eth-fiat/public-data/cost/1m/3m/5m/15m/paper 证据类型:paper-based(期刊全文为主,arXiv 预印本与数据源说明为辅)

源文件:research/quant_digests/2026-04-03_0355_same-underlier-multispread-optimizer-statarb.md

1. 这次看了什么

一句话核心结论

这篇论文真正值得 desk intake 的,不是“ETH 对不同法币也能做配对”这个表面结论,而是它给出了一条更适合我们迁移到 crypto short-cycle 的完整 skeleton:同一底层资产的多条相对价差做均值回归,信号层看 spread 偏离,组合层用 optimizer 把重叠腿净额化并做 market-neutral sizing

为什么这轮比继续补一个泛 filter 更值得

因为它补的是一条当前素材池里还不算拥挤的 same-underlier / same-asset relative-value raw alpha

最关键的硬数据

先记住这几组最有用的数字:

2. 先回答一句:这篇东西的 base alpha 是什么?

这轮 base alpha 很清楚

> 同一底层资产在多条 quote/venue/synthetic 路径上的相对定价不会永远一致;当其中一条腿短时偏贵、另一条腿偏便宜时,做多便宜腿、做空昂贵腿,赌偏离回归。

论文的写法是 ETH 对多个法币 quote; 对 desk 来说,更重要的抽象层其实是:

所以它不是:

它是一条可以独立站住的 relative-value / stat-arb raw alpha

3. 来源信息

3.1 主来源

3.2 数据源

4. 论文到底做了什么

4.1 交易对象不是“两种不同币”,而是“同一币的 quote bucket”

论文选的是 Kraken 上同一个底层资产 ETH,对四种法币 quote:

于是能形成 C(4,2)=6 条 spread:

翻成人话: 作者不是在赌 ETH 和 BTC 谁会重连,而是在赌“同一个 ETH,被不同 quote 体系映射出来的相对错位会回归”。

这点对我们很重要,因为它更像:

4.2 screening / formation:先验证这个 bucket 真的有相关性与协整基础

作者先用 2018-01-01 ~ 2020-01-01 的 ETH quote 数据做 formation / screening,按滚动一周去看相关性和 cointegration。

论文 Table 2 给了很直观的基础盘:

这说明: 这个 bucket 的 spread 不是瞎编的,至少在 formation 期里,它确实长期呈现“相关且多数时间可视作可回归关系”。

4.3 signal:核心不是 distance,而是 spread z-score 偏离

论文比较了两类东西:

真正该拿走的不是 DM,而是 OTT 里的这条 raw alpha 逻辑:

  1. 先把同一底层资产在多个 quote 下的价格序列标准化;
  2. 对每条 spread 计算相对偏离;
  3. 当某条 spread 的 z-score 超过开仓阈值时,
  1. 当 spread 回到更窄的 close band 时平仓。

论文用的是 threshold × spread standard deviation 的开平仓机制。 最赚钱的 grid-search 阈值(Table 3)是:

这些阈值看上去很大,但别误读成“9σ 神奇参数”。 它本质表达的是: 这个 same-underlier bucket 要吃的是很明显的离群偏差,不是轻微噪音摆动。

4.4 position logic:多条 spread 可以同时触发,所以不能再用“两腿 all-in”的老写法

这是论文最值钱的部分之一。

在普通两资产 pairs 里,信号一来,常见做法是:

但在 multispread bucket 里会出现:

这时就会有:

论文明确指出: multivariate 的真正增量不是“spread 变多了”,而是“多个 spread 同时触发时,资本分配本身变成了 alpha 生存的一部分”。

4.5 sizing / risk:bi-objective convex optimization 不是 alpha 本体,而是组合层核心组件

论文的 optimizer 目标是:

其 expected profit 不是纯历史均值,而是把:

目标函数再减去 λ × portfolio variance penalty

关键点:

论文还加了三个很实用的约束:

  1. 单 pair 的 long/short 权重不能超过可用资金;
  2. 单一货币层面的总占用不能超过 100%;
  3. 回到 ETH 单位后,long 与 short 保持 market-neutral(并考虑交易成本微调)。

翻成人话: 它不是让你在每条 spread 上各自下注,而是把整个 bucket 当成一个受资金占用约束的 market-neutral 组合来下单。

4.6 交易成本与市场中性假设

成本假设:

论文强调两点:

对 desk 而言,这意味着:

5. 最值得 desk 拿走的,不是 ETH/fiat 特例,而是 “same-underlier multispread OS”

如果只把这篇论文记成“ETH 对法币做多配对”,价值不大。

真正该拿走的是这三层:

5.1 raw alpha 层:same-underlier relative-value mispricing

这个最容易迁移:

这天然更适合 desk 的:

5.2 portfolio layer:重叠 spread 统一净额化

很多 raw alpha 回测都默认“每条腿单独开平”, 但同标的多路径里,真实情况往往是:

论文把这件事明确写成了优化问题,这对实盘特别有用。

5.3 risk-preference λ:把同一 alpha 拉成一条 risk/return frontier

论文不是只给一个固定仓位,而是给:

这给 desk 的启发是: 很多 same-underlier alpha 未必要靠“换新信号”提升收益,先把 entry 不变、只改 capital allocator,可能就能把策略从普通提升到可部署。

6. 结果里哪些数字最值得记

6.1 full-cycle:5m 是论文主结果里最像 desk 可迁移的一档

2021-01-15 ~ 2022-10-01 full-cycle,参与资产为 USD/CAD/GBP/EUR against ETH

OTT(0.1% fee)

DM(0.1% fee)

这说明:

6.2 bull:不是只有熊市避险才赚钱,bull 里也能跑

2021-01-01 ~ 2022-01-01 bull market:

也就是说, 这条 alpha 不是“只能靠大跌时回归”的熊市特供,它在强趋势 bull 里也能活。

6.3 bear:在 ETH 跌 -61.84% 的环境里仍能保正

2022-01-01 ~ 2023-01-01 bear market:

这再次说明它的收益来源更像:

6.4 risk / Sharpe:最激进的 λ=0.5 反而给出最好 Sharpe

Table 8:

这里最有意思的是: 在作者样本里,更激进的 allocator 不只提高收益,连 Sharpe 都提高了。 这提示我们:

6.5 trading metrics:不是“年化好看但靠一两笔大单”

full-cycle + λ=1 + 0.1% fee 的 Table 9:

这说明策略更像: 高频率但单笔优势不夸张,靠稳定正期望和腿间净额化生存。

6.6 交易成本真的是生死线

最直观的一组:

这轮最不能忽视的结论不是“5m 很强”,而是: 只要净额化做不好、成本模型写轻了,这条 alpha 会从可交易直接掉回论文收益幻觉。

6.7 Appendix A:同样骨架迁移到 BTC / SOL 仍有结果

作者还在 2020-10-01 ~ 2024-04-01 做了 ETH/BTC/SOL 的扩展测试(15m/60m/720m,参与法币为 USD/GBP/EUR)。

Table A2 在 15m + 0.1% fee + λ=1

对应风险指标:

这对 desk 的意义是: 它不是 ETH 专属现象;但越往流动性差、走势更极端的币种迁移,alpha 会明显变脆。

7. 这轮对当前 desk 的直接意义

7.1 它补的不是“又一篇 pairs”,而是同标的相对价差这条原型

当前 digest 池里已经有很多:

但这篇论文的新增值在于: 它把“同一底层资产的多路径价差回归”单独写成了一条完整策略,并把重叠腿优化分配明确建模。

所以它更像是:

7.2 为什么它比继续补一个 overlay 更值得

因为它直接服务于:

如果今天继续写一个 crowding gate 或 macro veto,当然也能加知识; 但和这篇相比,对“下一步能不能马上测一个新 raw alpha”帮助没这么直接。

8. 对 1m / 3m / 5m / 15m 的 desk 化映射

8.1 最自然的映射不是照抄 ETH 法币,而是改成同标的多路径 bucket

对于我们,最自然的映射对象是:

也就是说,论文里的法币 quote bucket 只是载体; 真正可迁移的是 same-underlier multispread 框架。

8.2 bar 频率如何映射到 1m / 3m / 5m / 15m

论文是 1m / 5m / 60m。 对 desk 我更建议:

原因很简单:

8.3 论文里的 threshold 不能直接照搬,但“极端偏离才动”这个精神应该保留

论文的最佳阈值达到 7σ~11σ,这在 perp 市场未必应原样照抄。 更合理的 desk 化做法是:

该保留的是: 同标的多路径错价,只有在明显异常偏离时才值得付成本去收敛。

9. 局限与踩坑

9.1 场景比 desk 真实环境更“干净”

论文场景是:

所以它天然比真实 perp/cross-venue 好做。

9.2 成本模型仍然偏粗

统一 0.1% flat fee:

9.3 阈值有数据挖掘风险

论文明确做了 retrospective grid search 来找最赚钱的 open_threshold / close_threshold。 这能给我们参数起点, 但不能直接当 live 最优参数照抄。

9.4 市场制度差异

法币 quote bucket 的错误定价机制,和:

所以它更像结构原型,不是现成 prod 配方。

10. 可复刻的最小实验

实验 A:先做 same-underlier 双腿 baseline

先回答: same-underlier mispricing 在我们现在可拿到的公共数据下,到底有没有 after-cost alpha。

实验 B:从双腿升级到 bucket-neutral multispread

在同一标的上放入三到四条路径,例如:

然后比较:

  1. pair-by-pair 独立开仓
  2. 统一 optimizer 净额化

关键指标:

这一步专门验证: 论文最值钱的 optimizer layer 到底是不是实盘增量。

实验 C:把 λ 当成 sizing frontier,而不是信号参数

固定信号,只改 allocator:

观察:

如果 desk 版本也出现“更激进 allocator 连 Sharpe 都更高”,那说明: alpha 本体比我们想象得更强,问题更多在执行层与容量层。

实验 D:做 honest cost ablation

最少要拆四层:

  1. maker-only fantasy
  2. maker/taker 混合
  3. 双腿不同时成交
  4. overlap netting 前 vs 后

因为这篇论文已经明确告诉我们: 这条策略不是先看 gross alpha,再顺手加成本;而是成本从第一天就是主角。

11. 下一步怎么测

  1. 先做 same-underlier baseline,不要上来就跑 generic pairs。 这篇最有价值的就是同标的多路径错价,不是跨币 cointegration。
  2. 优先测 5m + 15m3m 次之,1m 最后。 论文结果和成本敏感性都在提醒我们,不要一上来冲最细 bar。
  3. 一定做“独立 pair 开仓” vs “统一 optimizer 净额化”对照。 这决定我们是不是只是在重做旧 pairs,还是在复现它真正的新东西。
  4. 先用最液态的大币。 BTC/ETH/SOL 或主流 perp venue 足够;别一开始就扩到小票。
  5. 把资金占用和重叠腿暴露写进回测。 否则很多 bucket strategy 回测只是名义上 market-neutral,实际不是。

12. 一句话给当前项目的结论

这篇 2024 IJFS 论文值得进池,不是因为它又证明了“配对交易有用”,而是因为它把一条很适合 short-cycle desk 迁移的 raw alpha 骨架写清了:same-underlier multispread mean reversion 负责出信号,optimizer-based netting/sizing 负责让这条信号在多腿重叠与成本压力下仍有机会活下来。

13. 来源链接