← 返回 Quant Digests · 站点首页

别把这篇 2025 *Applied Sciences* 论文只读成黑箱分类器:对 desk 更该先测的是「order-book / taker-flow imbalance × confidence threshold」短周期 directional raw alpha,但 5m proxy 只有在 top-decile admission + maker-ish cost 下才刚转正

更新时间:2026-03-31 23:40 UTC 研究时间:**12 个月** 类型:2025 *Applied Sciences* 开放获取论文摘要/元数据 + OpenAlex/Crossref metadata + Binance USDⓈ-M Perpetual 公开 `5m` 本地 proxy quick check 主题标签:raw-alpha/microstructure/order-book/taker-flow/confidence-threshold/directional/single-asset/cross-asset/binance/perpetual/5m/15m/1m/3m/paper/public-data/cost 证据类型:论文摘要级硬结果 + 公共 kline/taker-volume proxy replication

源文件:research/quant_digests/2026-03-31_2320_orderbook-confidence-threshold-direction-alpha.md

1. 这次看了什么

这次主材料是 Alexandr Kuznetsov, Олексій Костенко, K.O. Klymenko, Zoriana Hbur, Roman Kovalskyi (2025), _Machine Learning Analytics for Blockchain-Based Financial Markets: A Confidence-Threshold Framework for Cryptocurrency Price Direction Prediction_, *Applied Sciences*。

先按这轮任务要求回答一句:

> 这篇东西的 base alpha 是什么? > > 答:短周期 order-book / taker-flow imbalance 所携带的方向信息,在高置信度时更容易转成下一段价格 follow-through。

所以它不是单纯的 ML 壳子,也不是“预测器外面再套一个风控阈值”。它的 alpha 本体很清楚:

这点对我们 desk 很重要,因为它直接对应 1m / 3m / 5m / 15m 的现实:

2. 论文里最值得记住的硬点

这篇 paper 最有价值的,不是“又有个神经网络准确率很高”,而是它把 方向预测是否执行 明确分开了。论文摘要给出的关键数字很硬:

翻成人话:

  1. 这不是想在全市场每个时点都出手;
  2. 它承认 coverage 低,但换来更高的每笔质量;
  3. 短周期 edge 的核心,不在宏观叙事,而在 order-book / flow microstructure
  4. confidence threshold 不是单独的 overlay,而是 alpha 从 paper edge 走向可执行策略 的必要组件。

3. 为什么它值得进当前素材池

当前 momentum 里已经有很多:

但还缺一张更明确的卡:

> 把“方向预测”本体和“什么时候值得下注”这件事分开写清楚的短周期 raw alpha 卡。

这篇 paper 值得收进池子,因为它满足本轮高优先级要求:

3.5 策略拆解(必填)

4. 这篇 paper 对 desk 最有价值的读法

这篇东西最值钱的地方,不是“神经网络比传统分类器强”,而是下面这句:

> trade / no-trade admission 本身,就是 alpha 的一部分。

很多短周期研究容易犯一个错:

这篇 paper 的 desk 化读法正好相反:

这其实比“再造一个更复杂的因子”更适合我们当前阶段。

5. 我先做了一个最便宜的 public-data proxy

为了避免只抄摘要,我做了一个很便宜的 desk 版 proxy,用的是 Binance USDⓈ-M Perpetual 公开 5m kline,因为它自带:

5.1 proxy 设置

这当然不是论文原版。论文用的是 daily macro + high-frequency order book microstructure 的神经网络框架;我这里只是先看一个便宜 proxy 能不能把它的核心命题——高 confidence admission 更值钱——保留下来。

5.2 proxy 的核心结果

测试集整体(不设 admission)只有:

但当我只打更高置信度区间时,质量确实单调上升:

| confidence bucket | coverage | accuracy | avg gross bps/trade | |---|---:|---:|---:| | 全部样本 | 100% | 53.10% | 0.82 | | top 30% confidence | 30% | 56.31% | 1.93 | | top 20% confidence | 20% | 57.34% | 2.78 | | top 15% confidence | 15% | 58.28% | 3.72 | | top 10% confidence | 10% | 59.94% | 5.04 | | top 5% confidence | 5% | 60.65% | 7.00 |

5.3 这组 proxy 怎么解释

这组数值其实非常有信息量:

  1. confidence threshold 的方向是对的。
  2. coverage 下降时,accuracy 和 gross edge 都在升。

  1. 但便宜 proxy 还远不够。
  2. 10 bps taker-ish 成本下,连 top 5% confidence 也还是约 -3.00 bps / trade

  1. 只有当执行成本降到 maker-ish 水平时,alpha 才开始勉强露头。

换句话说:

> 这条 alpha 不是“有点预测力就能拿去打”的类型。它更像一条必须同时满足“高 confidence + 低成本 + 更细 flow 特征”的精细化短周期 directional alpha。

这反而和论文精神是对齐的:paper 里真正的 edge,不只是分类器,而是 microstructure richness + selective execution 的组合。

6. 对 1m / 3m / 5m / 15m 的映射

6.1 5m

这是当前最自然的 admission 频率:

6.2 1m / 3m

更适合下一步补:

6.3 15m

更适合作为 持有期,而不是信号生成频率:

7. 对 desk 最值得拿走的完整策略壳

这条线不是只有“预测涨跌”四个字。第一版其实已经能写成完整策略:

Entry

Exit

Sizing

Risk

Cost

8. 下一步怎么测(直接给实验单)

实验 A:把 cheap proxy 升级成真正的 microstructure 版

实验 B:先拆 maker / taker,而不是先调模型

实验 C:confidence threshold 不要只看单阈值

实验 D:单币 vs 多币池

9. 风险与保留意见

10. 一句话结论

这篇 2025 *Applied Sciences* 论文最值得 desk 收进池子的,不是“又一个神经网络涨跌分类器”,而是这条更诚实的完整 raw alpha 读法:

order-book / taker-flow imbalance 的短周期方向 edge 只有在高 confidence 区域才值得下注;cheap 5m proxy 已经证明 admission rule 方向是对的,但要过成本,下一步必须上更细 order-book 特征和 maker/taker 拆分。

11. 来源

  1. Kuznetsov, A., Костенко, О., Klymenko, K.O., Hbur, Z., & Kovalskyi, R. (2025). _Machine Learning Analytics for Blockchain-Based Financial Markets: A Confidence-Threshold Framework for Cryptocurrency Price Direction Prediction_. Applied Sciences.
  1. OpenAlex metadata / abstract record
  1. Crossref DOI metadata
  1. Binance USDⓈ-M Perpetual Klines API
  1. 本地 proxy artifact