← 返回 Quant Digests · 站点首页
别把 copula pairs 只当分布学花活:这篇 2025《Financial Innovation》更该先复现的是「BTC reference spread-pair conditional mispricing」完整 raw alpha
更新时间:2026-04-10 21:02 UTC
研究时间:2026-04-10 21:00 UTC
类型:论文
主题标签:raw-alpha / pairs / stat-arb / relative-value / mean-reversion / copula / cointegration / BTC-reference / conditional-mispricing / market-neutral / binance / perpetual / 5m / 15m / paper
证据类型:开放获取论文全文 + 表格原文 + Binance USDⓈ-M 公共数据 portability probe
源文件:research/quant_digests/2026-04-10_2100_btc-reference-copula-spread-pair-alpha.md
- 时间:2026-04-10 21:00 UTC
- 类型:论文
- 主题类型:raw alpha
- 基础 alpha:
relative-value / pairs mean reversion —— 不是直接赌两条币价线回归,而是赌两条 BTC 对冲后的相对价值 spread在“联合分布条件失衡”后回到常态依赖结构
- 是否可独立复现:是
- 是否可直接落地完整策略(entry/exit/sizing/risk/cost):是
- 主题标签:raw-alpha / pairs / stat-arb / relative-value / mean-reversion / copula / cointegration / BTC-reference / conditional-mispricing / market-neutral / binance / perpetual / 5m / 15m / paper
- 证据类型:开放获取论文全文 + 表格原文 + Binance USDⓈ-M 公共数据 portability probe
1. 这次看了什么
我这次选的是 Masood Tadi, Jiří Witzany (2025), _Copula-based trading of cointegrated cryptocurrency Pairs_, Financial Innovation。
这篇值得 intake,不是因为“copula 听起来高级”,而是因为它给的是一条相对完整、可直接交易的 crypto pairs 骨架:
- 先用 BTCUSDT 当 reference asset;
- 把每个 alt 改写成
BTC - β_i * alt_i 的参考资产 spread;
- 在 formation window 里先做 cointegration + τ 排序选出本周最值得交易的两条 spread;
- 再用 copula 条件概率判断谁相对贵、谁相对便宜;
- 最后映射回真实下单腿:short β1·P1 / long β2·P2 或反过来。
所以这不是“pairs 外面再糊一层统计术语”,而是把 选对、定价、entry/exit、手续费、周度换对 都写进去了。对当前 desk 来说,它补的是一条完整 stat-arb / relative-value raw alpha,而不是又一篇只能当 filter 的材料。
2. 先回答:这篇东西的 base alpha 是什么?
一句话: base alpha 就是“BTC 对冲后的 alt-relative-value 均值回归”。
更细一点:
- 先把每个 alt 的大盘共性暴露,用
BTC - β_i * alt_i 剥掉;
- 再看两条这类 spread 的联合依赖关系;
- 当条件分布告诉你:
spread1 明显偏低、spread2 明显偏高(或相反)时,做一组 market-neutral long/short;
- 赌的是它们会往“平时的联合关系”收敛,而不是赌单边趋势。
所以它本质上是:
raw alpha:是
- 类型归属:pairs / stat-arb / relative-value / mean reversion
- 不是 filter,不是 overlay,也不是纯解释文。
3. 论文里最有价值的几件事
3.1 它不是直接拿 coin1-vs-coin2 做传统 z-score
论文最值钱的设计,是先把每个 alt 都改写成:
S_i = BTCUSDT - β_i * P_i
然后交易的对象不是“币价对”,而是两条 BTC-reference spreads 的相对错位。 这比传统 P1 - βP2 pairs 多了一层含义:
- 先把两条 alt 都投影到“相对 BTC 的偏离”;
- 再比较哪条 spread 在联合状态里更贵 / 更便宜;
- 这样更像在抓 alt-vs-alt 的相对价值,而不是把 BTC 大盘摆动误当作单对 alpha。
3.2 论文给了明确交易规则,不是只有“可解释性”
原文 Table 3 / 4 给的规则很清楚:
- 若
h1|2 < α1 且 h2|1 > 1-α1:
- 开
long S1 / short S2
- 映射到真实腿就是:long β2·P2, short β1·P1
- 若
h1|2 > 1-α1 且 h2|1 < α1:
- 开
short S1 / long S2
- 映射到真实腿就是:short β2·P2, long β1·P1
- 若两边都回到
0.5 附近:
- 平仓
这里 h1|2、h2|1 本质上就是 copula 条件概率,作者把它解释成相对误价概率。
3.3 它连 formation / trading schedule 都给了
论文不是“想到就做多空”那种散点想法,而是完整周度流程:
- 3 周 formation + 1 周 trading
- 总共 104 个滚动周期
- 样本:20 个 Binance USDT-M futures 合约
- 数据频率:hourly + 5-min
- 样本期:2021-01-22 ~ 2023-01-19
- 费用:明确按 Binance USDT-M maker 2bps / taker 4bps 讨论,并用 market order 成本记账
这就意味着: 它不是只能写成“研究备忘录”,而是本来就可以被 desk 直接改装成策略原型。
4. 论文原始结果里,最值得记住的数据点
4.1 5-min、EG test、α1=0.20 是文中最亮的主结果
原文 Table 6 给出的最佳 5-min 结果(reference-asset-based copula approach with EG test):
- Total net return:
205.9%
- Annualized net return:
75.2%
- Annualized Sharpe:
3.77
- Maximum drawdown:
-30.5%
- Transactions:
266
这说明它不是“理论上可行”;至少在作者的历史样本里,它是能活成一个完整策略的。
4.2 传统 baseline 在成本后明显更差
同篇 Table 7 很关键:
- 传统 cointegration z-score 在 5-min / EG 下:
- Total gross return:
121.4%
- 但 Transaction cost:
-681.2%
- 最终 Total net return:
-559.8%
- 传统 return-based copula 在 5-min / EG 下:
- Total gross return:
249.6%
- 但 Transaction cost:
-1388.4%
- 最终 Total net return:
-1138.9%
- 相对稳一点的 level-based copula 在 5-min / EG 下:
- Total net return:
17.9%
- Annualized Sharpe:
0.96
而作者自己的 reference-asset-based 版本在同样 5-min / EG 下能做到 205.9% net / 3.77 Sharpe。
翻成人话就是: 这篇 paper 的 edge 不只是“copula 比 z-score 更 fancy”,而是它确实在“高频 crypto pairs 容易被手续费打死”这件事上,给出了一条成本后仍能活的结构。
5. 为什么它和当前项目直接相关
当前 digest 池里已经有不少:
- 直接价差 z-score pairs
- Hurst / anti-persistence pairs
- dynamic-factor / Kalman / beta-gap
- 单资产均值回归
这篇的新增价值在于:
5.1 它补的是一种不同的 pairs 建模视角
不是:
而是:
- “先把每个 alt 变成 BTC-reference spread,再对 spread-pair 做条件误价判断”
也就是把 alt-vs-alt 的 relative value,先投影到 vs BTC 的坐标系里再交易。
5.2 它天然适合 short-cycle desk
原因很简单:
- 论文原生就做 5-min / hourly
- 费用显式纳入
- 周度 formation / trade 容易工程化
- 是真正的 market-neutral two-leg alpha,不必依赖方向行情
5.3 它服务的是 raw alpha 素材池,不是只当附属 veto
这条线单独就能成立:
- 有 formation
- 有 pair selection
- 有 entry/exit
- 有 sizing 映射
- 有 cost 假设
- 有 benchmark 对照
所以它不是“等某个 breakout 主信号出现后再帮你确认”的那类材料;它自己就是一个完整 relative-value sleeve。
5.5 策略拆解(必填)
- 方向属性:双向 / market-neutral / 相对价值回归
- 基础 alpha:BTC-reference spread-pair conditional mispricing 会向常态联合依赖结构回归
- regime:周度 formation 后,是否能找到足够稳定的 BTC-cointegrated 候选;以及 copula dependency 是否稳定
- filter / veto:
- formation 周里 cointegration 不成立则跳过
- τ 太弱 / dependency 太弱则不交易
- 条件概率没进入极端带则不进场
- risk / sizing / execution overlay:
- 仓位按
β1 / β2 映射到真实腿
- 周末或换周强平
- 成本至少按 taker
4bps/side 测
- 后续可加 maker 化、流动性上限、单周最大开仓数、事件禁做窗
6. 我做的 portability probe:先看这条思想能不能压到当前 Binance perp
6.1 快检口径
我没有做 paper 的 full faithful replication,而是做了一个对 desk 更快可复现的 transfer probe:
- 数据:Binance USDⓈ-M 公共 close 数据
- 资产:
BTC + ETH/BNB/SOL/XRP/ADA/DOGE/LINK/LTC/BCH/ETC
- 周期:
15m 与 5m
- formation / trading:沿用论文结构,21 天 formation + 7 天 trading
- 候选选择:
- 对每个 alt 先构造
BTC - β_i * alt_i
- 对 formation window 做 ADF,保留
p < 0.10 的 BTC-cointegrated spreads
- 在保留集合里选 |Kendall τ| 最高 的 spread-pair 作为本周交易对象
- copula 简化:
- 论文原版是多家族 copula + AIC 选模
- 我的 portability probe 为了快,改成 经验边际分布 + Gaussian copula proxy
- 交易阈值:沿用文中最亮的那档,
α1 = 0.20, α2 = 0.10
- 成本:按 taker
4bps/side 记换手成本
- 对照:同一周、同一对币,做一个传统直接价差 z-score baseline(entry
±2 / exit ±1)
6.2 结果:15m 和 5m 都是正的,而且明显优于直接价差 baseline
#### 15m portability probe(近 84d)
- active cycles:
8 / 9
- copula 版总 net return:
+27.7%
- 成本拖累累计约:
1.12%
- 关闭交易数:
14 笔
- 每笔平均 net return:约
+1.82%
- 同期直接价差 z-score baseline:
+4.6%
#### 5m portability probe(近 49d)
- active cycles:
4 / 4
- copula 版总 net return:
+11.6%
- 成本拖累累计约:
0.72%
- 关闭交易数:
9 笔
- 每笔平均 net return:约
+1.28%
- 同期直接价差 z-score baseline:
+2.1%
6.3 这版快检里,重复被选中的 pair 也有信息量
在这版简化迁移里,比较常出现的组合有:
ETH-SOL
ETC-LTC
ADA-LINK
DOGE-ETC
这说明这条线不是“什么 pair 都行”;它更像是: 在某些相对价值关系更稳定、同时又保留可交易波动的 pair 上,BTC-reference 表达法更容易跑出来。
6.4 这条 portability probe 最重要的判断
它最值得保留的不是绝对收益数字本身,而是下面这句:
同一批 short-cycle perp,reference-spread + conditional-mispricing 这套表达,明显比“直接价差 z-score”更像一条能活下来的 pairs skeleton。
7. 这篇 paper 真正适合 desk 先偷的,不是“copula 全家桶”,而是这 3 件事
7.1 先偷“reference asset representation”
很多 crypto pairs 一上来就直接:
这篇更值得先偷的是:
BTC - β1 P1
BTC - β2 P2
- 再比较这两条 spread 的相对失衡
也就是先统一对 BTC 去大盘暴露,再做 alt-vs-alt 的相对价值判断。
7.2 再偷“周度重选对 + 周内交易”
这篇不是永远抱着一对不放。 它告诉你:
- pairs 更像周度 roster,不是长期婚姻;
- formation 和 trading 应拆开;
- 找不到合格 pair 的周,可以空仓。
这对 live trading 很重要,因为它天然内置了不交易也是决策。
7.3 最后才是“copula probability bands”
对 desk 来说,copula 家族本身不是第一优先级。 第一优先级其实是:
- 你是否真的抓住了条件误价,而不是只看单条 spread 偏离;
- 你是否能把这种误价表达成稳定、低换手、成本后还能活的 long/short 规则。
所以工程实现顺序应该是:
- reference-spread universe
- 周度 pair funnel
- 条件误价带进出场
- 最后再升级 copula 家族选模
8. 风险与保留意见
- 我这次 portability probe 不是论文 full replication:
- 我用的是
Gaussian copula proxy
- 不是作者原文那套多家族 copula + AIC 最优选模
- 论文里关于 Kendall’s τ 的具体 ranking 表述有一点文字歧义;
- 我在 portability probe 里采用的是:在 BTC-cointegrated spread 候选里,选 |τ| 最高的 spread-pair
- 我只用了一小部分 liquid majors;
- 论文原始样本是 20 个 Binance USDT-M 合约,且有
EOS/TRX/XLM/ONT/IOTA/BAT 等币
- 当前 probe 只看 close-to-close,不含盘口 / 滑点 / funding / 强平链式冲击
- 这条线本质仍是 pairs / stat-arb;
- 一旦遇到单边结构性 re-pricing、共识切换或流动性断层,历史依赖结构可能会突然失效
9. 下一步怎么测
9.1 先做 faithful replication
优先把论文原版关键部件补齐:
- 20 币 universe 对齐 paper Table 1
- hourly + 5m 全样本重跑
- EG / KSS 都跑
α1 = 0.10 / 0.15 / 0.20 全扫
- 明确复刻 Table 6 / 7 的核心数字区间
9.2 再做 desk 版减法
如果 full replication 成立,下一步不是立刻上最复杂 copula,而是做一个 desk-friendly 版本:
15m 主版,5m 只做确认 / finer execution
- 保留 reference-spread 架构
- 条件概率可先用:
- Gaussian copula
- 或经验 copula / rank-based conditional bands
- 强制加:
- 单周最大交易次数
- 事件前后禁做窗
- maker/taker 分层
- 每周 pair stability veto
9.3 最该先看哪几个 admission 指标
- post-cost expectancy / trade
- 周度 active-cycle 占比(经常找不到 pair,则 live 频率不够)
- pair turnover 稳定性(是否总在少数 pair 上有效)
- 换手 / 成本占 gross 的比例
- 大波动周的 drawdown clustering
10. 来源
11. 一句话带走
这篇最值得 desk 先复现的,不是“copula 很高级”,而是:把 alt-pairs 先改写成 BTC-reference spreads,再用条件误价带做进出场,确实比直接价差 z-score 更像一条 short-cycle 可活的完整 stat-arb 骨架。