源文件:research/quant_digests/2026-03-26_0536_lob-lgbm-quantile-timing-alpha.md
1m 最小快检1s 级盘口状态、成交流与失衡特征,可以形成未来几分钟方向概率边;再用 signal = EWM((p_up - p_down) * (1 - p_mild)) 与滚动分位阈值把它转成可执行的 long-timing 策略> 先回答 base alpha:这不是 filter,也不是纯 execution 小技巧。base alpha 就是“当前 LOB / trade-flow 微观结构状态 → 接下来几分钟方向边”的单资产 directional raw alpha;repo 真正值钱的是它把这条边完整翻译成了 cost-aware 策略骨架。
主线材料不是论文,而是一份很新的 GitHub 仓库:
它的 headline 看起来像“用 1 秒级特征做 BTC 方向分类”,但对我们 desk 更有价值的其实不是分类本身,而是它已经把整条链条补齐了:
1s 特征工程所以它不是“又一个 microstructure explainability notebook”,而是一个可直接移植到 desk 的超短周期 directional alpha skeleton。
仓库没有直接把所有未来收益都硬分成涨跌,而是先定义一段 mild 中性区:
max(MILD_RETURN_THRESHOLD, fee_rate * threshold_multiplier)
这一步很值钱,因为它等于先承认: 小于手续费门槛的预测,就算方向猜对,也不该被当成可交易 alpha。
仓库的核心不是 argmax(class),而是:
signal = EWM((prob_positive - prob_negative) * (1 - prob_mild))
也就是:
p_up - p_down 表示方向边强弱1 - p_mild 给“远离噪声区”的样本更高权重这比“模型分类结果 > 0.5 就开仓”成熟得多。
进场与平仓条件不是一个手填阈值,而是:
buy: 当前 signal_score 高于过去滚动窗口的 0.9 分位close: 当前 signal_score 低于过去滚动窗口的 0.1 分位这非常适合 crypto,因为微观结构分布本来就会随流动性、时段、波动状态漂移。
仓库不是乱序交叉验证,而是:
TimeSeriesSplit(n_splits=5)对这种分钟内 / 秒级标签重叠很严重的问题,这是最起码的诚实做法。
仓库自带 overall_metrics_*.csv,给了多组 horizon 的 out-of-sample 汇总。最值得记的不是“准确率”,而是净收益、毛收益和持有时长怎么变。
cum_strategy_ret = -3.10%,cum_gross_strategy_ret = +0.25%,max_drawdown = -4.12%cum_strategy_ret = -3.61%,cum_gross_strategy_ret = -1.07%cum_strategy_ret = -0.22%,cum_gross_strategy_ret = +1.79%,max_drawdown = -2.17%cum_strategy_ret = +0.18%,cum_gross_strategy_ret = +2.00%,max_drawdown = -2.13%不是“3m 没边,所以 repo 无用”,而是:
换句话说:它是完整策略候选,但不是“拿来就能在 BTC 上直接抄作业”的完整策略。
best_bid / best_ask / mid / spread / micropriceimbalance_1 / imbalance_5 / depth ratio / slope / entropy / HHIsigned trade flow / place-cancel-fill counts / passive flow / net order flowPREDICTION_HORIZON 的中间价方向(当前配置为 180s)signal_score > lagged rolling q90 时,下一时刻按 best_ask 做多signal_score < lagged rolling q10 时,下一时刻按 best_bid 平仓score-strength bucket × spread-state × volatility-state 分层仓位min_hold_secondsmax_position_notional它和我们昨天那篇 3s microstructure taker alpha 不完全重复,差别在于:
因此它的价值不在于再证明一次 OFI / imbalance 有信息,而在于提供了 3 个我们可以直接拿走的组件:
这 3 个组件不止能服务单币 BTC,也能服务:
1m / 3m 单资产 event-driven long timing1m futures K 线后,还剩下多少影子我没复刻 repo 的完整 1 秒 order book,而是做了一个更便宜的代理快检:
数据源:Binance USDⓈ-M Futures 公共 1m K 线(BTCUSDT / ETHUSDT,最近 10 天)
代理特征:
taker_imbalance = 2 * taker_buy_base / volume - 1trade_count_zret1_zscore_conf这不是 repo 的正式 replication,只是看: 如果只能先拿公开便宜数据,repo 的微结构方向边能不能在 1m/3m/5m/15m 上留下痕迹?
ETH 比 BTC 更像能留下可见影子的标的。
ETHUSDT:score_conf 顶部 10% 事件,未来1m 平均收益约 +0.59 bps5m 平均收益约 +0.83 bps15m 顶/底 decile spread 约 2.00 bpsETHUSDT:若要求信号连续两根 1m bar 同向极端(2-bar persistence),未来1m 平均约 +1.21 bps3m 平均约 +0.72 bpsBTCUSDT:两根持续强信号后,未来3m 平均约 +0.48 bps5m 平均约 +0.59 bps1m/3m 事件触发或 execution timing,而不是直接改写成一个 bar-close 15m 主信号。如果强行把这份 repo 读成“BTC 3m long-only 现成策略”,我觉得不值得。
但如果把它读成下面这三件事之一,就很值得:
1m / 3m 事件驱动 long timing raw alpha当微结构压力连续两个分钟代理或若干秒级片段同向极端时,触发一笔独立 micro-trade。
5m 主策略已经想做多时,不是立刻吃,而是等:
signal_score 回到上分位并持续以后不管底层是 LASSO、LightGBM、LOB Transformer 还是简单 OFI,都可以统一套:
probability edge1s 公共数据复刻,不要再停在 1m 代理数据源:Binance Data Vision bookTicker / aggTrades / depth snapshots(公开可得)
标的:BTCUSDT / ETHUSDT / SOLUSDT
窗口:最近 14~30 天
30s90s180s因为 repo 结果已经暗示:太短容易被费用吃掉,太长又会把 micro edge 稀释掉。
N 秒同向才开仓IC(score, future_ret_h)gross edge per event (bps)net edge per event(至少做 fee / fee+0.5tick / fee+1tick 三档)events/dayholding-time distributionspread-conditioned pnl这是一条值得继续 intake 的 raw alpha 线,但当前最合理的定位不是“直接上 BTC 3m long-only”,而是:
1m / 3m:事件驱动 long timing alpha 候选5m / 15m:更像 execution timing / admission 组件micro-alpha governance template所以它进入研究池的理由不是“repo 绩效惊艳”,而是: 它把一个本来容易写成黑箱分类器的 raw alpha,拆成了可治理、可 stress、可迁移的完整骨架。
1m 代理快检保留的信息很有限,不能替代真 1s LOB replication。https://github.com/kailiu0712/-5-min-level-Directional-Prediction-for-Crypto-HFThttps://raw.githubusercontent.com/kailiu0712/-5-min-level-Directional-Prediction-for-Crypto-HFT/main/README.mdhttps://raw.githubusercontent.com/kailiu0712/-5-min-level-Directional-Prediction-for-Crypto-HFT/main/config.py10.1093/jjfinec/nbt003https://academic.oup.com/jfec/article/12/1/47/81616310.1111/mafi.12413https://onlinelibrary.wiley.com/doi/10.1111/mafi.12413https://fapi.binance.com/fapi/v1/klinesreports/artifacts/quant_digests/microstructure_lgbm_repo_probe_20260326/summary.csvreports/artifacts/quant_digests/microstructure_lgbm_repo_probe_20260326/persistence_summary.csvreports/artifacts/quant_digests/microstructure_lgbm_repo_probe_20260326/btcusdt_1m_10d.csvreports/artifacts/quant_digests/microstructure_lgbm_repo_probe_20260326/ethusdt_1m_10d.csv