源文件:research/quant_digests/2026-03-25_0318_single-asset-microstructure-taker-alpha.md
3s 中间价收益;当预测值超过阈值时,按预测方向立即吃单> 先回答 base alpha:不是 filter,不是纯解释。base alpha 就是“当前盘口/成交流微观结构状态 → 未来几秒收益方向”的单资产 directional raw alpha。
主线材料是:
这轮我不把它读成“又一个 OBI 解释文”或者“又一个做市教程”,而是把它拎回最适合我们 desk 的形态:
单资产、事件驱动、极短持有、可直接吃单执行的 microstructure raw alpha。
它和我们前面已经看过的两类东西不一样:
3s 收益,然后做阈值型 taker 交易。bookTicker + trades 做了 1 天最小快检,确认最基础的方向信息确实还在。关键数据点(论文):
1s 级 order book + trades,样本从 2022-01-01 到 2025-10-12,覆盖 BTC / LTC / ETC / ENJ / ROSE。目标变量是未来 3s mid log return。ETC:ARC 5.78,IR* 8.97,t-test p=0.0431ENJ:ARC 4.06,IR* 6.58,t-test p=0.0368ROSE:ARC 7.00,IR* 5.28,t-test p=0.0192BTC maker 还不错:ARC 2.93,IR* 5.47ENJ / ETC / ROSE maker 明显弱很多,甚至接近负收益,说明这条 edge 更先像 taker directional alpha,不是“先验适合做市”的 alpha。关键数据点(我做的本地最小快检,公开 Binance 原始数据,1 天样本,仅作方向复核):
ROSEUSDT(2024-01-15):用 order_flow_imbalance + depth_imbalance + vwap_pressure + relative_spread 的简单线性 proxy,在测试半天内,对未来 3s 收益的相关系数约 0.137;强信号多头事件平均下一段收益约 +0.684 bps,强信号空头事件约 -0.812 bps。ENJUSDT 同口径相关系数约 0.191;强信号多头约 +1.043 bps,强信号空头约 -0.929 bps。1m/3m/5m 因子后并不稳定:ROSE 在 3m 还有一点形状,ENJ 则明显发散。这说明它更适合做 event-driven micro alpha / execution alpha,而不是直接硬改造成逐根 5m/15m 主信号。1m / 3m 的高强度短周期研发;对 5m / 15m 也不是没用,但更应先定位成:depth_imbalance = (bid_size - ask_size) / (bid_size + ask_size)order_flow_imbalance = (buy_volume - sell_volume) / (buy_volume + sell_volume)buy_vwap_dev = (buy_vwap - mid) / midsell_vwap_dev = (sell_vwap - mid) / midvwap_pressure = ((buy_vwap*buy_volume) - (sell_vwap*sell_volume)) / ((buy_volume+sell_volume)*mid)r_{t→t+3s},当 |prediction| > θ 时按符号开仓prediction > θ 做多;prediction < -θ 做空3s / 5s / 10s / 20s)|prediction| / rolling_vol / spread state 做分层仓位max_position_notional如果强行问:它对我们 1m / 3m / 5m / 15m 有什么直接意义?
我的判断是:
1m / 3m 的 event-driven alpha5m / 15m 的 execution / veto / timing layer5m/15m 主 raw alpha原因很简单:这条 edge 的生成机制是微观结构状态的瞬时偏移,不是慢变量。 你把它压得太粗,信号会被 bar 内路径抵消掉。
所以对 desk 更合理的读法不是:
而是:
1m / 3m bar 内出现持续 N 秒的一致微观结构压力时,触发一笔独立 micro-trade”;或研究假设: OFI + depth imbalance + VWAP pressure 在 Binance perp 上可形成可交易的超短周期单资产 raw alpha,但真实可交易性高度依赖 threshold × hold_seconds × fee/slippage × spread state。
数据源与公开性:
bookTicker 与 trades1s最小实验设计(最应该先做这个,而不是先上复杂网络):
BTCUSDT / ETHUSDT / ROSEUSDT 三档流动性14~30 天 1s 数据train 7d / test 1d 滚动3s / 5s / 10s / 20s80/90/95/97.5)而不是拍脑袋固定值fee only / fee+0.5tick / fee+1tick / latency stress最先看 5 个指标:
IC(score, next_ret_3s)avg bps per triggered eventevents/daypost-cost pnlspread-conditioned pnl(窄 spread vs 宽 spread)最关键的下一步,不是再调模型,而是这 3 个实验:
N 秒同向才触发,看看能否把噪声降下去3s 即衰减,还是能拖到 10~20s1m/3m 的 execution layer10.48550/arXiv.2602.00776https://arxiv.org/abs/2602.00776https://arxiv.org/html/2602.00776v1https://arxiv.org/pdf/2602.00776.pdfhttps://github.com/amazingchow/epcmhttps://github.com/amazingchow/epcmbookTicker, trades).reports/artifacts/quant_digests/epcm_microstructure_probe_20260325/summary_1s.csvreports/artifacts/quant_digests/epcm_microstructure_probe_20260325/summary_bars.csvreports/artifacts/quant_digests/epcm_microstructure_probe_20260325/roseusdt_test_predictions_head.csvreports/artifacts/quant_digests/epcm_microstructure_probe_20260325/enjusdt_test_predictions_head.csv