源文件:research/quant_digests/2026-03-21_2135_purged-embargo-overlap-honesty-gate.md
我这轮不是再找一个新 trigger,而是补一层更直接服务三条收口线的“评估诚实门”:看 CombinatorialPurgedCV(skfolio)和 Purged/Embargo 方法怎么防止时间重叠泄漏,并用本地 15m trade log 做了最小快检。
signal -> hold N bars 的 15m 策略,先不处理 train/test 区间重叠,再漂亮的 OOS 都可能偏乐观。signal_ts ~ exit_ts)做重叠统计,结果显示随机切分时重叠非常高,而 purged + embargo 能把这块泄漏显式扣掉。reports/artifacts/scout_rank70_fast_entry_slow_exit_handoff_15m/trade_log.csv,baseline_exit)显示:breakout_short 44.5%fib_retest_long 38.8%ema_psar_long 50.5%breakout_short 2.55%(额外 embargo 0.73%)fib_retest_long 5.39%ema_psar_long 1.69%fib_retest_hold 的重叠敏感性在这组数据里最高。这轮和三条收口线是直接相关,不是“统计洁癖”:
V3 final-verdict / breakout-short follow-up:很多 verdict 都是事件后若干根 K 的路径判决,若 train/test 区间重叠,容易把“同一段波动结构”重复学习。Fibonacci confirmation / retest_hold:回踩确认天然有 clustered signals,最容易出现标签区间互相覆盖。EMA / PSAR raw alpha focus:raw edge 本来就薄,少量泄漏就可能把 OOS 符号翻正,导致错误晋级。所以这一刀的价值是:在继续收口前,先保证“我们看到的 OOS 改善”不是评估口径送的。
研究假设:三条线里,凡是带 hold 8 bars 或更长管理窗的规则,如果不用 purged/embargo,OOS 会系统性偏乐观。
最小可计算定义:
[signal_ts, exit_ts]H(默认 8 bars)内的 train 样本最小回测切口:
next-bar open + no-overlap + 6/10/15 bps先看 2 个指标:
OOS Sharpe / Calmar 在 random split vs purged split 的降幅winner retention(random split Top-N 在 purged split 还能留几条)入池门槛建议(第一版):
embargo_size 必须跟最大持仓窗、特征延迟窗口一致;写太小仍会漏,写太大会过度砍样本。https://www.oreilly.com/library/view/advances-in-financial/9781119482086/https://doi.org/10.2139/ssrn.2326253https://ssrn.com/abstract=2326253https://skfolio.org/generated/skfolio.model_selection.CombinatorialPurgedCV.htmlhttps://github.com/skfolio/skfoliohttps://random-docs.readthedocs.io/en/latest/implementations/cross_validation.htmlreports/artifacts/literature/purged_embargo_overlap_quickcheck_2026-03-21.csvreports/artifacts/literature/random_split_overlap_benchmark_2026-03-21.csv