← 返回 Quant Digests · 站点首页

别把 copula pairs 只读成高阶 dependence 拟合:这篇 2023 arXiv 更该先测的是「BTC 参考腿 + 双 spread 条件误价」完整 raw alpha

更新时间:2026-03-28 11:49 UTC 研究时间:2026-03-28 11:48 UTC 类型:2023 arXiv 全文 PDF + 本地全文抽取 主题标签:raw-alpha/pairs/stat-arb/relative-value/copula/cointegration/btc-reference/spread-mispricing/conditional-probability/kendall-tau/binance/usdt-perpetual/hourly/15m/5m/1m/3m/paper/public-data/cost 证据类型:论文全文证据 + desk 化映射

源文件:research/quant_digests/2026-03-28_1148_btc-reference-copula-spread-mispricing-alpha.md

1. 这次看了什么

先把 base alpha 说清楚:这不是 filter,也不是“copula 让 pair 看起来更 fancy”。它的 raw alpha 本体是——

  1. 先用 BTCUSDT 做参考腿,给每个 alt 构出 S_i = BTC - β_i * ALT_i 这类 spread;
  2. 在 formation 期里,从 19 个候选 alt 里挑出和 BTC 关系最稳定、且彼此最适合组成双 spread 的两条;
  3. 交易期里不直接看 z-score,而是把两条 spread 过各自边际分布后,放进 copula 里算条件概率 h_{1|2}, h_{2|1}
  4. 当一条 spread 相对另一条明显被高估/低估时,开 long one spread / short the other spread,吃的是 relative mispricing 的回归

这点和我们最近已经 intake 过的一批 cointegration + z-score pairs 主题不一样:那批主要在“怎么定义 spread 偏离”;这篇真正新增的是“怎么定义 spread 之间的相对误价”。对当前 desk 来说,它的价值不是再讲一遍 pairs,而是给 stat-arb 素材池补了一个更像 signal layer upgrade 的 raw alpha 版本。

2. 核心结论

先给结论,不绕:

论文最值钱的不是“copula 能拟合尾部相关”这种泛结论,而是它给出了一条完整、可复现的策略链:

更关键的是:它不是只能作为 pairs 的二级确认层,而是本身就能独立成一个完整的 relative-value / stat-arb 策略。

3. 为什么和当前项目直接相关

最近 desk 已经积累了不少 cointegration / z-score / OU / Hurst 路线的 pairs 素材。继续只补同一类“spread 偏离 -> 回归”当然没错,但边际增量会越来越低。这篇 2023 arXiv 的价值在于,它补的是 signal construction 的另一条主线:不是单看某条 spread 偏离多大,而是看“两条可比 spread 之间,谁相对谁被错定价了多少”。

这很适合当前研究阶段,原因有三:

  1. 它仍然是 raw alpha,不是旁支 filter。
  2. 它天然服务 stat-arb / relative-value 方向的素材池扩充。 我们当前的 raw alpha 库里,pairs 很多仍是 single spread + threshold;这篇多了一层 cross-spread relative mispricing
  3. 它比继续找一个泛化 overlay 更值得。 因为它回答的是“还能不能从公开可得的 Binance perp 数据里,构出一个完整的、可复现的 pairs/stat-arb alpha”,而不是“又多一个可能有帮助的 gate”。

3.5 策略拆解(必填)

4. 论文里真正可直接复现的机制

4.1 数据与形成窗口

论文作者:Masood Tadi, Jiří Witzany

数据口径:

这已经足够 desk 化:它不是日频股票,也不是难拿的数据,而是公开可得、可直接映射到 perp 的 crypto 衍生品数据

4.2 参考腿与 spread 定义

论文固定 BTCUSDT 为 reference asset,对其他 19 个 alt 分别构造:

S_i,t = BTCUSDT_t - β_i * P_i,t

其中 β_i 来自 formation 期回归估计。然后:

  1. 对 19 条候选 spread 做 Engle-Granger (EG)Kapetanios-Shin-Snell (KSS) 检验;
  2. 对通过 cointegration 的候选,再计算与 BTC reference 相关的 Kendall's Tau
  3. 选出 Tau 最高的两条 spread,作为下周 trading 的 S1, S2

翻成人话:不是任意抓两条 alt spread 乱做,而是先筛出“相对 BTC 最稳定、最可比较”的两条,再看它们彼此的误价。

4.3 Copula 信号怎么定义

形成期里,作者先给 S1, S2 各自拟合边际分布(候选包括 Gaussian、Student-t、Cauchy 等),再把 spread 通过各自的 CDF 变成 U1, U2 ~ Uniform(0,1),然后在 (U1,U2) 上拟合 copula。

交易期里,每根小时 bar 计算:

信号规则非常直接:

论文固定 α2 = 10%,测试多个 α1。最佳结果出现在 α1 = 10%

这套规则很值得 desk 直接拿去做最小实验,因为它已经完整覆盖了:

5. 关键实证结果

5.1 哪些 copula 真正在样本里最常出现

104 个 trading week 的模型选择结果里,最常出现的不是 Student-t,而是偏极值/非对称家族:

这个点很关键:如果我们 desk 化时只偷懒用 Gaussian / Student-t,很可能已经把论文里最重要的 dependency 形状信息丢掉了。

5.2 收益、Sharpe、回撤

论文表 VI 的结果(均已计交易费):

Pairs Trading with EG test

Pairs Trading with KSS test

对照组:

翻成人话:这篇不是“绝对高 Sharpe 神器”,但它证明了 copula-based dual-spread mispricing 在 Binance perp 公共数据口径下,至少能独立活成一条完整策略,不只是理论花活。

5.3 阈值怎么影响表现

论文一个很实用的结论是:α1 提高后,交易次数会增多,但风险调整后表现反而下降。

这对短周期 desk 很重要,因为它提醒我们:copula 信号不是越敏感越好,threshold 宽松化带来的往往是更多噪声交易,而不是更高 edge。

6. 和当前短周期(1m/3m/5m/15m)的关系

原论文频率是 1h,所以它对我们最自然的映射不是直接压到 1m,而是:

更具体地说,这篇最值得我们搬的不是“1h alpha 本身”,而是这四个 desk 组件:

  1. BTC reference spread construction
  2. weekly rolling formation/trading schedule
  3. copula conditional-probability entry/exit
  4. threshold sensitivity / cost-aware deployment

如果要映射到 15m,一个自然做法是:

7. 最小可复现实验(现在就能做)

7.1 公开数据源

7.2 最小实验口径

我会建议第一轮别直接追求 full replication,而是做一个 15m desk transfer MVP

  1. UniverseBTC, ETH, SOL, XRP, ADA, DOGE, BNB, LINK, LTC, TRX 等高流动 perp。
  2. Formation:滚动 21d15m 数据。
  3. Spread 构造
  1. Signal
  1. Entry / Exit
  1. Cost

8. 下一步怎么测(必须)

  1. 先做 “copula vs plain z-score” 正面对照。
  1. 把原论文的 1h 逻辑迁到 15m,但不要一上来压到 1m
  1. 加入 max-hold 与 structure-break veto。
  1. 只在高流动 bucket 里测。
  1. 记录 copula 家族稳定性。

9. 风险与保留意见

10. 来源

  1. Tadi, M., & Witzany, J. (2023). _Copula-Based Trading of Cointegrated Cryptocurrency Pairs_. arXiv preprint.
  1. Binance Developers. USDⓈ-M Futures API – Kline/Candlestick Data.

11. 本地相关产物