← 返回 Quant Digests · 站点首页

别把 RL2 当黑箱神谕:这篇 2024 论文更适合先复现「cointegration spread raw alpha + dynamic sizing」完整策略骨架

更新时间:2026-03-24 14:20 UTC 研究时间:2026-03-24 14:24 UTC 类型:论文 + GitHub 复现仓库 + 本地最小快检 主题标签:raw-alpha/pairs/stat-arb/relative-value/mean-reversion/cointegration/dynamic-sizing/cost/1m/3m/5m/15m 证据类型:论文证据 + 工程复现仓库 + 本地最小快检

源文件:research/quant_digests/2026-03-24_1424_rl2-pairs-dynamic-scaling-fullstack.md

1. 这次看了什么

一句话先答:这篇东西的 base alpha 是“协整价差偏离后的均值回归”(不是 RL 本身)。本次选的是 Yang & Malik (2024) 的 RL pairs 论文,核心价值在于把一条可独立复现的 pairs raw alpha,直接扩成 entry/exit/sizing/risk/cost 的完整策略骨架;并用复现仓库和本地 1m/3m/5m/15m 快检看它在我们 desk 语境下是否可落地。

2. 核心结论

3. 为什么和当前项目有关

当前 desk 正在补“可独立复现、可直接落地”的 raw alpha 池,这篇正好是 pairs / stat-arb / mean reversion 路线的完整模板:

3.5 策略拆解(必填)

4. 可复刻的最小实验

5. 风险与保留意见

6. 来源

1) Yang, H., & Malik, A. (2024). *Reinforcement Learning Pair Trading: A Dynamic Scaling Approach*. Journal of Risk and Financial Management, 17(12), 555.

2) FHLiang221 (GitHub, 2025). *RL-Pairs-Trading-Replication*.

3) 本地最小快检(2026-03-24)