源文件:research/quant_digests/2026-04-04_2028_ga-triplebarrier-pair-label-veto-alpha.md
15m portability probe这次主线看的是:
10.3390/math120507800 results)这篇东西对我们有价值,不是因为它又往 pairs trading 上糊了一层 AI,而是因为它很明确地把一个 desk 真会遇到的问题拆了出来:
> 不是每次 spread 偏离都值得做。
pair mean reversion 这条 base alpha 大家都知道;真正难的是:
1m/3m/5m/15m 的真策略,应该把这个判断层放在哪。这篇 paper 的答案是: 用 triple-barrier 先给交易事件打标签,再用 GA 优化标签口径,最后用分类器决定这笔 pair dislocation 到底该不该做。
---
base alpha = cointegrated spread 的均值回归。
翻成人话:
所以在我们的框架里,这篇东西应该归类成: raw alpha(pairs mean reversion),不是纯 filter / regime / overlay。
原因很简单: 如果拿掉 pair spread 这条底层均值回归,分类器本身并不产生 alpha;它只是帮助这条 alpha 少做一些烂单。
---
最近素材池里,pairs 类原型已经不少:
但仍然有一个空档没有补得很清楚:
> “同样一条 spread 偏离,哪些该做,哪些该放掉?”
这篇 paper 的增量恰好在这里:
HRHP(高风险高收益)与 LRLP(低风险低收益)两类目标,这一点很适合我们 desk 后面拆成两个 deployment 档位。也就是说,这轮写它,不是因为我们缺一个新的 spread alpha headline;而是因为我们缺一个能接在 raw alpha 后面、真正决定“要不要做这笔 spread”的 admission layer 模板。
---
根据 DOAJ 摘要页,论文主链路是:
HRHP = High Risk, High ProfitLRLP = Low Risk, Low Profit摘要里最关键的数字有 4 个:
HRHP 标签训练出来的模型,盈利能力提升 51.42%LRLP 标签训练出来的模型,最大回撤(MDD)降低 73.24%这 4 个数字已经足够说明它不是“又一篇泛泛 AI trading 论文”: 它讨论的是非常具体的交易问题——同一个 pair shell,可以做成 aggressive 赚钱版,也可以做成 defensive 控回撤版。
这对短周期 desk 很重要,因为我们后面落地时完全可以拆成:
research mode:多保留事件,追求样本密度;live mode:更强调 veto,优先控回撤。---
先别把 paper 读成“分类器直接做交易”。 它可迁移的前提是: 你本来就有一条可解释的 pair spread shell。
最小落地建议:
BTC/ETH/SOL 起步,再扩到 top-liq perp;Engle-Granger / Johansen + residual ADF + rolling beta stability;15m,再下探 5m/3m;|z| >= z_entry 且不是连续重复触发时生成候选交易事件。也就是说: 模型的输入不该是“任意时刻的价格”,而该是“已经满足 pairs alpha admission 的候选事件”。
这是 paper 最值钱的部分。
对我们 desk 来说,triple barrier 可以这样移植:
N 根 K 线还没完成预期,就强制平仓 / 视作低质量事件。然后把 barrier 参数本身交给网格或 GA 去找,不要手写死:
z_entryz_tpz_slmax_holdcooldownvol-scaled or fixed barrier这一步的意义不是“让优化器替你找圣杯”,而是: 让标签更贴近真实执行目标,而不是用一个与交易脱节的未来收益回归目标。
论文里用的是 AdaBoost classifier。
对我们 desk,这个选择反而是好消息:
1m/3m/5m/15m 这类需要快迭代、快解释、快修 bug 的研发节奏。第一版特征完全可以先用这些:
entry_z, abs_z, dz重点不是“模型多强”,而是: 模型只回答一个问题——这次 spread dislocation 值不值得做?
最适合我们的执行读法不是“模型发 BUY/SELL/HOLD”,而是:
take / skip 或 aggressive / defensive;也就是: 分类器应该是 admission layer,不要让它反客为主变成整个策略。
最小实盘化建议:
z 回到 0.5 ~ 1.0 区间,或 spread hit fixed target;z 继续发散到 3.0 ~ 4.0;8 ~ 24 bars;论文强调标签工程,但对我们 desk 来说,交易出场仍要尽量显式、稳健、低解释成本。
这篇 paper 很适合拆成两个 sizing 档:
HRHP:LRLP:desk 层面可直接落到:
p(size) = f(pred_prob, spread_vol, pair liquidity)gross cap per pairsector / underlier concentration capdaily loss throttlepair raw alpha 的坑一直都不是“有没有信号”,而是:
所以这个主题进研究池的前提,是把成本放到策略壳里,而不是写成 paper-summary 式“预测更准,因此可交易”。
最小成本建模建议:
round-trip spread cost:先按 8~20 bps 场景化;---
15m portability probe:结论不是“直接赚钱”,而是“veto 层确实能明显减伤”为了不只停在 paper 摘要,我做了一个很轻量的本地迁移检查,文件在:
reports/artifacts/quant_digest_2026-04-04_pair_label_gate/pair_label_gate_summary.csvreports/artifacts/quant_digest_2026-04-04_pair_label_gate/pair_label_gate_test_trades.csv数据:
BTCUSDT / ETHUSDT / SOLUSDT 近 365d、15m K 线缓存BTC-ETH, ETH-SOL, BTC-SOL最小策略壳:
|z| >= 2.0 触发候选事件|z| <= 1.0|z| >= 3.5max_hold = 24 bars8 bps标签与模型:
entry_z / dz / spread slope / corr / vol ratio / rv ratio 等结构化特征AdaBoosttake / skip聚合结果(ALL 行):
单对里相对最像样的是 BTC-ETH:
这组快检没有证明“粗糙版 15m pair label gate 已经能直接实盘赚钱”; 它证明的是另一件更重要的事:
> paper 的核心命题是对的——分类式 veto 层确实能明显少做烂单。
但它也同时提醒我们:
这反而是个好消息: 因为它说明后续要投入研发的重点非常明确——标签口径、事件定义、成本壳、pair admission 稳定性。
---
这轮证据足够把主题纳入研究池,也足够支持“下一步怎么测”; 但如果要进入更高优先级复现,还是应该补一轮全文抓取/人工细读。
若底层 pair shell 很差,label classifier 只能减少伤害,不能凭空把烂 alpha 变成好 alpha。
如果 label 没把成本、滑点、time-stop 真正纳进去,模型最后学到的很可能只是“哪些事件更极端”,而不是“哪些事件更值得做”。
1m/3m 上,事件密度与噪音都会更高barrier 设计若不按波动与流动性缩放,很容易把模型训练成“全 skip”。
---
先做一个最小研究任务:
BTC/ETH/SOL/LTC/BNB/XRP 等高流动 pair 候选15m,再迁到 5mEG/Johansen + residual ADF + rolling beta stability|z| >= {1.8, 2.0, 2.2}tp_z ∈ {0.5, 0.75, 1.0}sl_z ∈ {3.0, 3.5, 4.0}max_hold ∈ {8, 12, 16, 24}profit-first(更接近 HRHP)drawdown-first(更接近 LRLP)Logit / XGBoost / AdaBoost,不要一上来搞深网测完后不要只看收益,要回答两个更现实的问题:
15m 成立,再下探 5m/3m1m 先不急,先把:
这些东西补齐。否则 1m 很容易把策略变成 churn machine。
---
这篇 2024 paper 值得进池,不是因为它又做了个“AI pair trading”标题党,而是因为它把一个真实而关键的问题讲清楚了:
> pairs raw alpha 的关键增量,不一定是再换一个 spread 模型,而可能是把“哪次偏离值得做”这层 admission / veto 单独做出来。
对当前 short-cycle desk,我会这样定位它:
如果要排优先级: 这篇不是“今天就能上实盘”的成品, 但它非常值得作为 pairs alpha admission layer 的核心素材,进下一轮最小实验。
---
DOI: <https://doi.org/10.3390/math12050780> Readable URL: <https://doaj.org/article/786d82c1b7034df5b5ec7a8bc8fb9f05> Repo URL: not found in public exact-title GitHub repo search.
DOI: <https://doi.org/10.1109/compsac54236.2022.00201> 用途:作为 crypto pairs 中“动态过滤 / 交易稳定性优先”的近邻参考,不是本轮主文。
/root/clawd/jerry/momentum/reports/artifacts/quant_digest_2026-04-04_pair_label_gate/pair_label_gate_summary.csv/root/clawd/jerry/momentum/reports/artifacts/quant_digest_2026-04-04_pair_label_gate/pair_label_gate_test_trades.csv