← 返回 Quant Digests · 站点首页

别把这篇 2025 ML arbitrage 论文直接抄成黑箱分类器:对 desk 更该先测的是「inventory-funded cross-venue quote gap × confidence threshold」完整 raw alpha

更新时间:2026-03-30 21:24 UTC 研究时间:2026-03-30 21:05 UTC 类型:2025 *International Journal of Network Management* 论文摘要元数据(Crossref)+ Binance/OKX/Bybit 公开 spot API live quick check 主题标签:raw-alpha/relative-value/stat-arb/cross-venue/same-underlier/spot/arbitrage/quote-gap/confidence-threshold/inventory-funded/binance/okx/bybit/btc/eth/xrp/doge/1m/3m/5m/15m/paper/public-data/cost 证据类型:论文摘要级证据 + 公开 live API 快检

源文件:research/quant_digests/2026-03-30_2105_crossvenue-confidence-threshold-arb-alpha.md

1. 这次看了什么

这次主看的是一篇很新、而且很像“可直接 desk 化”的跨所套利论文:

如果只用一句人话概括,这篇东西真正值得我们拿来测的,不是“机器学习又来预测市场了”,而是:

> 先承认跨所价差这件事本来就存在,再把“什么时候这次价差真的值得打”写成一个 confidence-threshold admission rule。

这就比“看见跨所差价就无脑搬砖”诚实得多,也比“纯 ML 黑箱方向预测”更符合我们当前的短周期研发目标。

2. 核心结论

先把 base alpha 说清楚:

> base alpha 不是 ML。base alpha 是同一标的在不同 venue 的 quote gap / micro dislocation 会在极短时间内回归;ML 只是决定“这次 gap 值不值得打”的 admission layer。

这篇 paper 从摘要里给出的最有价值信息有 4 点:

  1. 它研究的是跨交易所 arbitrage,不是单所方向预测。 也就是说,主题本身就是 relative value / stat-arb,符合当前 desk 要补的 raw alpha 池。
  2. 它不是等“罕见大价差”才动,而是想提前预测离散时间窗口内是否会出现可盈利 arbitrage。 这点对 1m / 3m / 5m 特别重要,因为真正的问题不是“有没有 gap”,而是“能不能在 friction 前提下留下净边”。
  3. 它把信号使用方式写成 decision threshold,而不是分类概率直接下单。 这对 desk 的意义非常大:先有 gap,再有 probability/confidence,最后才有 trade on / trade off
  4. 论文摘要声称整套策略 1 周收益超过 100%。 这个数字非常夸张,默认不能直接信;但恰好反过来提醒我们:应该偷的是它的 admission logic,不是它的 headline 收益率。

一句话核心结论:

> 对 desk 更值得先测的,不是“ML 会不会神奇预测一切”,而是“跨所 quote gap 本身是 raw alpha;confidence threshold 只是把可打事件筛得更干净”。

一句话说明它怎么证明:

> 论文摘要明确把研究对象写成“跨所 arbitrage strategy + ML + improved decision threshold”,并宣称只有在模型置信度足够高时才触发套利;再配合我们对 Binance/OKX/Bybit 公开 top-of-book 的 live 快检,可以确认 raw quote gap 的确经常出现,但绝大多数边本身很薄,必须靠 admission rule 和成本治理。

3. 为什么和当前项目有关

这轮值得 intake,原因很直接:

  1. 它是 raw alpha,不是解释型材料。 base alpha 就是 cross-venue same-underlier quote-gap convergence
  2. 它是完整策略候选。 有 entry(gap+hurdle)、exit(gap close/max hold)、sizing(inventory/capacity)、risk(venue/quote-age kill-switch)、cost(maker/taker/withdrawal 不同场景)这整条链。
  3. 它补的是 relative-value / stat-arb 素材池。 不是继续在 breakout / trend 单线内循环。
  4. 它天然适配短周期。 真正的时间尺度不是日频,也不是 8h funding;而是 sub-second -> 1m 的事件流,3m/5m 只是为了容纳执行摩擦与对账。

3.5 策略拆解(必填)

4. 3 个关键数据点

4.1 论文摘要给出的 headline 很激进

Crossref 收到的摘要原文写到:

这个收益数字默认只能当 待复核 claim,不能当已验证事实。

4.2 公开 live quick check:majors 的 raw top-of-book cross-gap 确实频繁出现

我用 Binance / OKX / Bybit 公共 spot API,对 BTCUSDT / ETHUSDT / DOGEUSDT / XRPUSDT 做了 12 次、约 1.5 秒间隔 的 distinct-venue 最优 bid-vs-ask 快检(只允许 bid venue != ask venue)。结果:

这说明:可观察的 raw gap 并不稀缺

4.3 但 raw gap 很可能不够厚,除非你是“有库存的人”

同样一组 live 数据也说明另一件事:

所以这条线更像 inventory-funded micro stat-arb,不是链上转账搬砖。

5. 真正值得 desk 先偷哪一段

最该偷的不是“用哪个模型”,而是它的逻辑顺序:

  1. 先确认 raw alpha 存在: 有没有 distinct-venue 的净价差事件;
  2. 再确认成本后是否还有肉: fee/slip/inventory carry/quote staleness 都算进去;
  3. 最后才上 confidence threshold: 只打最像真机会的子集。

也就是说,正确的研发顺序不是:

> 先堆模型 -> 找到高概率 -> 再去想交易什么。

而应该是:

> 先定义 best_bid - best_ask 的 executable gap -> 跑 friction ladder -> 再看一个极简 classifier / threshold 有没有增益。

这非常适合当前 desk,因为它不要求我们先搞一个重型预测系统;先从 rule-based threshold baseline 起步就够了。

6. 可复刻的最小实验

6.1 数据源、公开性、更新频率

6.2 最小可复现实验口径

  1. 标的先只做高流动 BTCUSDT / ETHUSDT / XRPUSDT / DOGEUSDT
  2. venue 先只接 3 所:Binance / OKX / Bybit。
  3. 定义 executable gap:
  1. 定义可交易门槛:
  1. 方向:
  1. 出场:
  1. 第一轮 baseline:
  1. 第二轮才加 classifier:

6.3 第一轮先回答什么

7. 这张卡最容易错在哪里

8. 为什么值得进入研究池

它值得进池,不是因为我们已经相信论文收益,而是因为它满足当前 Scout 最看重的几条:

  1. 数据稳定可拿。 三大所公开 book/ticker 足够起步;
  2. 规则能清楚写成 trade-on / trade-off。 gap、成本、置信度、quote age 都能落成规则;
  3. 能很快做 first verdict。 连历史大样本都不用先等,先抓 1~3 天高频快照就能判断有没有肉;
  4. 是完整 raw alpha。 不是纯 filter,也不是解释型综述。

对当前 desk,这条线的价值在于:

> 它把“跨所价差”从一个泛泛而谈的 old story,压缩成了一个非常适合 1m / 3m 研发节奏的 executable alpha 候选。

9. 下一步怎么测

  1. 先做 72 小时跨所 quote 采集。 BTC / ETH / XRP / DOGE × Binance / OKX / Bybit,保留 top-of-book、size、timestamp、quote age。
  2. 先跑纯 baseline,不上 ML。 比较 0.5 / 1 / 2 / 3 / 5 bps raw gap 阈值,在不同 friction 假设下的净边与事件数。
  3. 把持仓前提写死:inventory-funded only。 同时记录各 venue 库存占用,别偷换成链上搬砖。
  4. 第二轮再加 confidence threshold。 先从极简 logistic/GBM 做起,看它相对阈值基线是否真的提升 net expectancy,而不是只提升 in-sample accuracy。
  5. 如果 majors 太薄,就转向次一层高流动 alts。 但仍要坚持先跑 friction ladder,再决定是否值得进正式 admission check。

10. 来源

论文 / 元数据

公开 live 数据接口(本次快检)