源文件:research/quant_digests/2026-03-30_1348_onchain-vol-spike-btc-mr-alpha.md
3m/5m 出现短窗过冲后的快速均值回归这次主看 Timothy King Avordeh、Christopher Quaidoo、Samuel Arthur (2026) 的开放获取论文 Hybrid machine learning and stochastic volatility models with blockchain data for high-frequency cryptocurrency trading(*Discover Analytics*)。论文用 2025-01 到 2025-03 的 Bitcoin 1m 数据(129,600 observations),把 Heston 波动框架 + LSTM + 链上特征(transaction count / fee-related activity) 拼成一个高频预测器,再拿一个 5m hold 的交易模拟去比较 Heston / LSTM / Hybrid。
我不打算把它直接抄成“又一个模型论文”,也不准备把作者写出来的 long vol / short low-vol 规则原样搬进 desk。对我们更值钱的读法是:把它重读成一个公开链上数据驱动的 BTC 快速均值回归 raw alpha 候选——先问“链上冲击 + 预测波动尖峰之后,价格是不是容易过冲后回归”,再决定要不要上更重的 Heston-LSTM 壳子。
on-chain shock × predicted vol spike 可以作为 BTC 1m/3m/5m 快速均值回归事件锚点。1m 预测框架、交易模拟和表格结果;我们再把其中最可迁移的部分——链上冲击与波动尖峰——转成可做 first verdict 的事件信号。R² 也从 Heston 的 0.72、LSTM 的 0.80 提到 0.85。这说明链上特征至少在“识别高波动分钟”这件事上,不只是装饰。10.2% / 1.3 / 6.8% 和 LSTM 的 14.8% / 1.7 / 5.5%。1m 频率、60min lookback LSTM、输入含 lagged vol / return / trading volume / blockchain transaction count,再配 5m 持有、1%~5% 动态仓位、2% 单笔止损、10% 日内回撤上限。就算先不复刻 Heston-LSTM,事件定义 + 成本口径 + 风控框架 已经够做第一轮 clean-room 验证。最近几轮 intake 里,pairs / cross-sectional / carry / relative-value 已经补得比较密,但 “单币、分钟级、公开链上数据驱动的 fast MR” 还不够厚。这篇 paper 值得插进来,原因很直接:
链上冲击 + 预测波动尖峰 → 短窗 post-spike edge。1m/3m/5m。 不是拿日频宏观量硬降采样,也不是只能做低频 regime。aggTrades/klines;链上侧可以从公开 mempool / chain API 拿 transaction / fee-rate proxy。vol-spike event、fee shock gate、sign A/B mapping、post-spike hold horizon 这些组件都能复用于别的单币事件型 alpha。如果一定要回答“它为什么比继续补一条普通 raw alpha 更值得”:因为它不是再给我们一条同质化 breakout / pairs 变体,而是在 公开链上数据 → 单币极短窗 alpha 这条还偏稀缺的支线上,给了一个可以马上做 first verdict 的新入口。
3m~5m 出现冲击后回归,而不是无限延续1%~5% 动态仓位、2% 单笔止损、10% 日内回撤上限、默认 taker 成本先按 round-trip 20 bps 压测,持有 3/5/10 根 1m bar 三档on-chain shock × predicted vol spike 识别的是短期失衡而不是长期趋势,因此 BTC 在随后 3m/5m 更容易出现 fast mean reversion。BTCUSDT Spot/Perp aggTrades 或 1m klines(公开、分钟级、实时/历史都容易拿)。mempool.space 公共 API 的 fee-rate / mempool congestion proxy,或其他公开 BTC chain API 的 transaction-count / fee proxy(公开、近实时;历史 minute 级需要自行归档或抓取镜像)。1m realized vol、lagged return、relative volume、fee-rate shock、tx-count shock 训练一个简单 Logit / LightGBM,预测“下一根是否进入 top-decile vol state”;P(high-vol) 超过阈值,分别跑两条对照:3/5/10 根 bar;1m 绝对收益进入过去 30d 同时段 99% 分位,且 P(high-vol) > 0.7,并伴随 fee-rate 或 tx-count shock > rolling 95% 分位。3/5/10 根 bar;或价格回到事件前 anchor VWAP / mid 的 30%~50% 区间即止盈;若 adverse move > 0.6~0.8 ATR(5m) 立即止损。after-cost pnl/trade、MFE/MAE、MR vs continuation、fee-shock on/off uplift、trade count/day、vol-state calibration。0.1% 交易成本在 BTC 1m/5m 上不算离谱,但若真实滑点高于设定,很多纸面优势会被吞掉。10.1007/s44257-025-00046-1https://link.springer.com/article/10.1007/s44257-025-00046-1https://link.springer.com/content/pdf/10.1007/s44257-025-00046-1.pdfhttps://developers.binance.com/docs/binance-spot-api-docs/rest-api/market-data-endpointshttps://mempool.space/docs/api/rest