← 返回 Quant Digests · 站点首页

别把 microstructure 只做成 OBI 做市:这篇 2026 论文+同名仓库更值得先复现的是「单资产 OFI + VWAP pressure taker raw alpha」

更新时间:2026-03-25 03:20 UTC 研究时间:2026-03-25 03:18 UTC 类型:2026 arXiv 论文 + 2026 GitHub 同名工程仓库 + Binance 公共原始数据最小快检 主题标签:raw-alpha/microstructure/time-series/order-flow/imbalance/vwap-pressure/taker/maker/binance/perpetual/1s/1m/3m/paper/repo/execution 证据类型:论文证据 + 工程证据 + 本地快检

源文件:research/quant_digests/2026-03-25_0318_single-asset-microstructure-taker-alpha.md

> 先回答 base alpha:不是 filter,不是纯解释。base alpha 就是“当前盘口/成交流微观结构状态 → 未来几秒收益方向”的单资产 directional raw alpha。

1. 这次看了什么

主线材料是:

这轮我不把它读成“又一个 OBI 解释文”或者“又一个做市教程”,而是把它拎回最适合我们 desk 的形态:

单资产、事件驱动、极短持有、可直接吃单执行的 microstructure raw alpha。

它和我们前面已经看过的两类东西不一样:

  1. 不是把 OBI 塞进双边做市 reservation price 的那条线;
  2. 也不是横截面 taker-flow 排名那条线;
  3. 它更像是:用统一的微观结构特征库,直接预测单币未来 3s 收益,然后做阈值型 taker 交易。

2. 核心结论

关键数据点(论文):

  1. 数据口径:Binance Futures 永续,1s 级 order book + trades,样本从 2022-01-01 到 2025-10-12,覆盖 BTC / LTC / ETC / ENJ / ROSE。目标变量是未来 3s mid log return
  2. taker 回测最强的不是 BTC,而是中小币
  1. maker 并不天然更优
  1. 极端行情验证:2025-10-10 flash crash 中,论文写到 taker 策略的异常持仓时间大约 20 秒,而平时多是 1~2 秒;maker 则因为逆向选择在崩盘中被持续打穿。

关键数据点(我做的本地最小快检,公开 Binance 原始数据,1 天样本,仅作方向复核):

  1. ROSEUSDT(2024-01-15):用 order_flow_imbalance + depth_imbalance + vwap_pressure + relative_spread 的简单线性 proxy,在测试半天内,对未来 3s 收益的相关系数约 0.137;强信号多头事件平均下一段收益约 +0.684 bps,强信号空头事件约 -0.812 bps
  2. ENJUSDT 同口径相关系数约 0.191;强信号多头约 +1.043 bps,强信号空头约 -0.929 bps
  3. 但把秒级信号粗暴压成 bar-close 1m/3m/5m 因子后并不稳定:ROSE 在 3m 还有一点形状,ENJ 则明显发散。这说明它更适合做 event-driven micro alpha / execution alpha,而不是直接硬改造成逐根 5m/15m 主信号。

3. 为什么和当前项目直接相关

3.5 策略拆解(必填)

4. 这条线最有价值的,不是“预测对不对”,而是“怎么映射到 desk”

如果强行问:它对我们 1m / 3m / 5m / 15m 有什么直接意义?

我的判断是:

原因很简单:这条 edge 的生成机制是微观结构状态的瞬时偏移,不是慢变量。 你把它压得太粗,信号会被 bar 内路径抵消掉。

所以对 desk 更合理的读法不是:

5. 可复刻的最小实验(下一步怎么测)

研究假设OFI + depth imbalance + VWAP pressure 在 Binance perp 上可形成可交易的超短周期单资产 raw alpha,但真实可交易性高度依赖 threshold × hold_seconds × fee/slippage × spread state

数据源与公开性

最小实验设计(最应该先做这个,而不是先上复杂网络):

  1. 标的BTCUSDT / ETHUSDT / ROSEUSDT 三档流动性
  2. 采样:先做最近 14~301s 数据
  3. 信号:先只用 4~6 个 paper 原生特征,不加花哨深度学习
  4. 训练/验证:walk-forward,至少做 train 7d / test 1d 滚动
  5. 持有期网格3s / 5s / 10s / 20s
  6. 阈值网格:按预测分布分位数(如 80/90/95/97.5)而不是拍脑袋固定值
  7. 成本阶梯fee only / fee+0.5tick / fee+1tick / latency stress

最先看 5 个指标

最关键的下一步,不是再调模型,而是这 3 个实验:

  1. signal persistence:只有信号连续 N 秒同向才触发,看看能否把噪声降下去
  2. hold-seconds sweep:检验这条 alpha 是 3s 即衰减,还是能拖到 10~20s
  3. taker-only vs maker-off switch:在 spread 扩大或盘口失衡极端时,maker 是否应该直接关闭

6. 风险与保留意见

  1. 先做 taker event-driven 版本
  2. 再把它接到 1m/3m 的 execution layer
  3. 最后才考虑 maker 化或更复杂的 queue 模型

7. 来源

  1. Bieganowski, B., & Ślepaczuk, R. (2026). _Explainable Patterns in Cryptocurrency Microstructure_. arXiv.
  1. amazingchow. (2026). _epcm_. GitHub repository.
  1. Binance Data Vision. USDⓈ-M Futures public historical data (bookTicker, trades).

8. 本地快检产物