源文件:research/quant_digests/2026-04-01_0138_l1-imbalance-vwap-spread-direction-alpha.md
这次看的是 Bartosz Bieganowski, Robert Ślepaczuk (2026) 的 _Explainable Patterns in Cryptocurrency Microstructure_(arXiv:2602.00776)。论文用 Binance Futures perpetual 的 1 秒级 order book + trades,覆盖 BTC / LTC / ETC / ENJ / ROSE,2022-01-01 ~ 2025-10-12,目标是预测 未来 3 秒 mid-price log return,然后用一个很保守的 taker / maker 回测去看这套微观结构信号到底能不能交易。
base alpha 很清楚:订单簿失衡 + 成交压力会先于短期价格继续同向移动;但一旦 spread 过宽,alpha 更像被 adverse selection 和成本吃掉。
所以它不是纯解释型论文,也不只是“做个 SHAP 图看看”。 它的 alpha 本体就是:用 order-book / taker-flow 的同向共振,去抓超短周期 directional follow-through。
最值得 desk 先测的,不是整套 CatBoost 黑箱,而是「L1 imbalance × VWAP-to-mid × spread gate」这组可手写、可解释、可移植的短周期 directional raw alpha。
作者直接在 1 秒 Binance perpetual 数据上做 walk-forward 训练与保守回测;不仅给出统计解释(SHAP 排名 / 依赖形状),还给出交易层证据:taker 端在多只资产上显著优于 buy-and-hold,而 maker 端在 flash crash 里被 adverse selection 明显打穿。
最近 intake 已经明显堆了很多 pairs / relative value / carry / basis;这篇东西补的是另一块同样重要但当前更稀缺的拼图:
5m/15m alpha 当 execution trigger / entry admission 的微观结构特征库;换句话说,它比再补一篇“又一个 spread MR”更值得的地方,在于它能同时服务两件事:
1m/3m directional alpha;5m/15m raw alpha 提供更快的入场确认与 execution veto。2022-01-01 ~ 2025-10-12,5 个币覆盖大中小市值层级。我不会先照抄论文里的 CatBoost。 更值得先偷的是它反复出现的那条可手写特征关系:
所以 desk 的第一版不必从 ML 开始,而可以先做一个 score-based alpha:
score = z(L1_imbalance) + z(net_taker_notional) + z(vwap_buy/sell_to_mid) - z(spread)
当 score 进入正/负分位极值区,且 spread 未超阈值时,顺着 score 方向做短持有 continuation。
5m/15m 肯定太粗;必须做时间聚合或把它改成 execution trigger。把 1 秒级微观结构特征压成 1 分钟信号后,top-decile directional score 仍能预测未来 1m/3m 收益方向;若 1m/3m 能活,再看能否迁移成 5m/15m 的入场确认层。
bookTicker / depth + aggTrades(实时 WebSocket 可公开获取;历史可用自行录流或公有归档)BTC/ETH/SOL 三个高流动性 perp,连续录流 2~4 周,按 1 秒聚合后生成 minute scorescore;若 |score| 进入过去 20 天分位前 10%,且 spread 分位 < 80%,按 score 方向入场1m 或 3m;若中途出现反向极值 / spread blowout 也提前平仓1/vol 或 score 分位缩放4 / 8 / 12 bps round-trip friction ladder;若只在 0~4 bps 存活,就把它降级为 execution trigger,而不是独立主 alpha1m/3m 上 top-decile score 的方向命中率、gross edge、cost 后 edge 都明显高于全样本这篇纸面上像 explainable ML,但对 desk 真正值钱的,是它把一个常被说得很玄的东西讲实了:
短周期 directional alpha 不一定要先从复杂模型开始,先把 imbalance / taker flow / VWAP 偏移 / spread 这四个最稳定的经济变量写成 rule-based score,就已经足够做第一轮 honest admission check。
所以我会把它放进研究池的位置定为:
1m/3m directional raw alpha 候选5m/15m 既有趋势 / breakout / continuation 的 execution trigger先做一个 两阶段 transfer:
只测 BTC/ETH/SOL 的 1m -> 1m/3m directional score,确认它在 taker 成本后是否还有 pocket。
如果独立 alpha 太短、太吃成本,就把它接到现有 5m/15m raw alpha 上,只保留:
如果 B 能明显改善 entry quality 或回撤控制,这篇东西就算没有单独跑成一条主策略,也已经值回票价。