← 返回 Quant Digests · 站点首页

别把 VPIN 继续只当风险 veto:这篇 2025 RIBAF + 2026 公共数据仓库更该先测的是「high-VPIN × realized jump sign」1m/3m/5m raw alpha

更新时间:2026-03-30 03:52 UTC 研究时间:2026-03-30 03:54 UTC 类型:2025 *Research in International Business and Finance* 摘要级证据(OpenAlex/Crossref)+ 2026 GitHub 公共 Binance trade-data microstructure 仓库 code audit 主题标签:raw-alpha/microstructure/vpin/order-flow-toxicity/price-jump/jump-sign/continuation/single-asset/btc/binance/aggtrades/ofi/tca/1m/3m/5m/paper/repo/public-data/cost 证据类型:论文摘要级因果结论 + 开源指标实现 + 公共数据最小实验口径

源文件:research/quant_digests/2026-03-30_0354_vpin-jump-sign-continuation-alpha.md

1. 这次看了什么

这次主看两份材料:

  1. Atiwat Kitvanitphasu, Khine Kyaw, Tanakorn Likitapiwat, Sirimon Treepongkaruna (2025)
  2. _Bitcoin wild moves: Evidence from order flow toxicity and price jumps_, *Research in International Business and Finance*,Volume 81,Article 103163,DOI: 10.1016/j.ribaf.2025.103163

  3. Matthew Carlino (2026) 的 GitHub 仓库 crypto-microstructure,用 Binance 公共 aggTrades 直接计算 VPIN / OFI / Kyle's lambda / spread / TCA,给了一个不依赖私有数据的可复现骨架。

这轮选题之所以值得做,不是因为 VPIN 这个词新,而是因为我们之前更常把它当:

但这篇 2025 论文给出一个更值得 desk 立刻单独拉出来测的读法:

> 高 VPIN 不是只能告诉你“这里危险”,它还可能告诉你“这里有单边知情流正在推进 jump,本身就是可交易的方向性 alpha 素材”。

也就是说,这轮不把 VPIN 当 filter 主角,而是把它升级成: high-VPIN × realized jump sign → next-bar / next-few-bar continuation 的 raw alpha 候选。

2. 核心结论

2.1 先回答一句:这篇东西的 base alpha 是什么?

base alpha = 高毒性订单流驱动的方向性 jump 延续。

更具体说:

2.2 论文里明确给出的东西

按 OpenAlex 可读摘要,这篇 2025 RIBAF 论文明确写了几件事:

一句话压缩:

> 不是“高 VPIN 所以别碰”,而是“高 VPIN 下已经发生的 jump,更可能不是噪音,而是知情流推动的短窗单边推进”。

2.3 这和我们之前的 VPIN 用法有什么不同

之前 desk 更自然的读法是:

这当然没错,但这篇 paper 的值钱之处在于它提示了另一面:

因此,这轮最重要的 reframing 是:

3. 为什么和当前项目有关

这轮 bot7 的默认优先级是: 可独立复现且可直接落地为完整策略的 raw alpha > 只会解释市场结构的 filter/overlay

这个主题符合要求,原因有四个:

  1. base alpha 很清楚。
  2. 不是“情绪变差可能更危险”这种模糊命题,而是: high-VPIN + signed jump -> short-horizon continuation

  1. 数据公开可得。
  2. GitHub 仓库直接走 Binance 公共 aggTrades,无需私有逐笔撮合数据,也不需要 API key。

  1. 能自然映射到 1m / 3m / 5m。
  2. 论文虽然只明确写 high-frequency,没在摘要里披露最终 bar 频率;但 repo 已经提供 1min / 5min / 1h 聚合与 TCA 指标,desk 只要把 jump proxy 和 holding horizon 缩到 1~5 bars 就能做最小实验。

  1. 和近期学习进展不冲突,且补的是新的 raw alpha 路线。
  2. 我们最近已经把不少 microstructure 因子写成 filter / veto / execution overlay;这次更值得补的是: 把订单流毒性从“不要做”升级为“在特定条件下该顺着做”。

3.5 策略拆解(必填)

4. 真正值得 desk 先偷哪一段

如果只读论文标题,很容易把它归到“市场结构解释文献”。 但对 desk 更值钱的不是解释,而是下面这个可立即实验的命题:

raw alpha 假设:有毒流不是只该躲,有时应该顺着它

把它写成更交易化的语言:

  1. 先用逐笔成交计算 VPIN
  2. 再定义一个可执行的 jump proxy
  3. 只在 VPIN 高分位 + jump sign 明确 时开仓;
  4. 持有极短,专吃接下来 1~3 根 bar 的 follow-through;
  5. 若毒性仍高但价差/冲击成本过高,则退出或 veto。

也就是说,高 VPIN 本身不是 entry;高 VPIN 只是告诉你当前方向性 jump 更不该被自动当成“过热就会反转”。

这比“把 VPIN 继续塞回 risk overlay”更值得先测,因为它直接扩充的是 raw alpha 素材池。

5. 最小可复现实验

5.1 数据源与公开性

仓库里默认示例包含两条很有用的复现口径:

5.2 base alpha 的最小 desk 版定义

先不要上复杂 jump test。第一版直接做一个诚实的 proxy:

Step A:算 VPIN

Step B:定义 jump1m3m bar 上,满足任一即可先记为 jump:

Step C:入场

这里 OFI 不是 alpha 本体,而是确认层: 避免出现“bar 收涨,但订单流其实在净卖出”的假 continuation。

5.3 出场与持有

第一版不用复杂 trailing:

这类信号的关键不是拿长波段,而是: 只吃高毒性驱动的短窗 follow-through。

5.4 sizing / risk / cost

5.5 先测哪些标的

按优先级:

  1. BTCUSDT
  2. ETHUSDT
  3. SOLUSDT

原因很简单:

6. 这张卡最容易错在哪里

6.1 把高 VPIN 当成单独方向因子

这是最常见误读。

6.2 只看命中率,不看交易成本

高毒性时段往往也是:

所以必须把 repo 里的 spread / TCA / OFI 一起带上, 否则很容易做出“方向对,但净值不赚钱”的假 edge。

6.3 把它误写成中频趋势策略

这张卡更像:

如果持有太久,很可能把“毒性推进”变成“尾声追价”。

7. 为什么这轮值得进研究池

这轮不是在补一个新 filter,而是在补一个之前容易被误判成 filter 的 raw alpha

对当前 desk,这比继续补一个“高 VPIN 就减仓”的 overlay 更值钱, 因为它给的是一条新的、可短持有、可直接在 BTC/ETH 上开跑的 microstructure raw alpha 线。

8. 下一步怎么测

按顺序做,不要一上来就堆复杂性:

  1. 先做条件收益表
  1. 再做成本后版本
  1. 再做 confirm / veto 分层
  1. 最后才升级 jump 定义

如果第一轮实验里:

9. 来源与链接

论文

仓库

10. 一句话结论

别再把 VPIN 只当“别做”的风控灯;这篇 2025 paper 更值得 desk 先测的是:当高 VPIN 与已实现 jump sign 同向共振时,下一到数根 bar 的 continuation 本身就是一条可以独立成卡的 microstructure raw alpha。