← 返回 Quant Digests · 站点首页

别把这份 2026 v5 bot 读成“AI 下注工具”:它真正可独立复现的 base alpha,是「Binance 领涨/领跌 × Polymarket 最后 120 秒滞后定价」

更新时间:2026-04-03 16:48 UTC 研究时间:2026-04-03 16:47 UTC 类型:2026 GitHub 新 repo source audit(GitHub API metadata + `README.md` + `config.py` + `signal_engine.py` + `risk.py` + `executor.py` + `bot.py` + `analyze.py`)+ Polymarket / Chainlink / Binance 公共接口路径校对 主题标签:raw-alpha/cross-market/relative-value/prediction-market/polymarket/binance/chainlink/5m/15m/hard-expiry/final-window/lag-arb/maker-mode/kelly/late-entry/external-data/repo/public-data/cost/risk 证据类型:GitHub README/source 规则级证据 + 公共数据接口可达性/字段路径校对

源文件:research/quant_digests/2026-04-03_1647_polymarket-finalwindow-lagarb-alpha.md

1. 这次看了什么

先把 base alpha 说清楚:

> 这不是 AI alpha,也不是 event scanner,也不是“让 LLM 决定要不要买”。真正的 alpha 本体,是 Binance/Chainlink 先动、Polymarket 二元赔率后动。

翻成人话:

这条线为什么值得进当前素材池?因为它满足几件很难同时满足的事:

  1. raw alpha 很清楚:不是 gate,不是 overlay,本体就是 binary-price underreaction;
  2. 频率天然贴 5m/15m:不是硬把日频材料强行压成快周期;
  3. 策略组件完整:entry / exit / sizing / risk / cost 都给出来了;
  4. 和 desk 当前短周期方向直接相邻:虽然交易 venue 不是 perp,但底层驱动仍是 crypto 秒级价格发现。

一句话结论先放前面:

> 这份 repo 真正有价值的不是“AI 过滤器”,而是“临近到期的 binary 合约,能不能被 leader venue 的超短 momentum/OFI 抢跑”。如果要做最小实验,先把 AI 全关掉,只测 final-window lag arb。

2. 核心结论

2.1 这份 repo 的主线到底是什么

主仓库是:

repo README 标得很明白:

所以别被 README 的“AI v5”抢走注意力。按对 desk 最有用的读法,repo 里真正该 intake 的东西是:

> 用 leader venue 的短秒级价格变化去估一个临近到期 binary market 的 fair value,然后只在最后时间窗里、只在 edge 足够厚的时候出手。

2.2 规则壳已经给到什么程度

config.pysignal_engine.pyexecutor.pyrisk.py 可以直接拆出完整骨架:

#### 数据与市场

#### Entry logic(核心) repo 的信号不是“看涨就买”,而是一个 fair-value vs current-binary-price 的差值交易:

  1. 从 Binance tick history 里算 10s / 30s / 60s 三档 momentum;
  2. 再加一个 momentum acceleration(最近 10s 比 30s 更强还是更弱);
  3. 加一个 consecutive tick direction,要求最近 15s 至少有连续同向 tick;
  4. 再把这些拼成一个 fair value ∈ [0.05, 0.95]
  5. 如果 fair > Polymarket YES,买 YES;否则买 NO;
  6. 只有在 edge_pct >= min_edge_pctlag_pct >= lag_threshold_pct 时才下单。

repo 里默认参数:

这其实已经是一个完整 raw alpha:

> binary 合约价格没有及时反映 leader 价格变动时,买低估概率。

#### 时间窗(非常关键) repo 最值钱的不是“买不买”,而是 什么时候才值得买

也就是:

这点对 short-cycle desk 很重要,因为它说明:

> alpha 不是“全时段都存在”,而是高度 time-conditioned。

#### 执行逻辑 repo 明确区分 maker 与 taker:

成本假设:

所以这条 alpha 的经济学并不是“随便方向对了就行”,而是:

> 如果你能以 maker 低成本挂进去,1.2% 的 edge 也许够;如果你要用 taker 冲进去,成本会把大部分薄 edge 直接吃掉。

#### 仓位与风控 repo 不是 fixed size,而是 Kelly 缩放:

也就是说,它不是单纯的信号脚本,而是已经把:

2.3 这份 repo 最值得 intake 的,不是 AI

v5 README 一眼看过去最显眼的是 AI filter,但从 source 看,AI 更像一个 可选 overlay,不是 alpha 本体。

更关键的是,signal_engine.py 里 AI filter 那段调用顺序本身就值得警惕:

这意味着:

  1. repo 作者想表达的是“AI 只做 pre-trade validation”;
  2. 但当前实现顺序看起来并不适合把 AI 当主研究主题;
  3. 第一轮复现应默认关闭 AI,先把纯 quant lag-arb 壳跑通。

这正好也符合本轮 intake 原则:

> 不要把 overlay 伪装成 raw alpha。

3. 为什么和当前 desk 直接相关

先回答一句:

> 为什么这东西比再补一篇普通 trend/pairs 更值得?

因为它补的是当前库里相对少的一类:

它和当前 desk 的关系有三层:

3.1 它本身就是一条完整 raw alpha

而且是少数能把以下都写清楚的:

3.2 它天然落在 5m / 15m

很多低频材料要硬压成快周期会变味;这条不是。 它的市场本体就是:

所以最小实验可以直接做,不需要先发明“如何把日频论文缩成 5m”。

3.3 它还能反向服务我们对 perp alpha 的理解

如果未来不直接做 Polymarket,这条材料仍有 desk 价值:

换句话说:

> 先把它当 standalone 策略看;若不做 binary 执行,再把它降级成“外部确认/对照市场”。

3.5 策略拆解(必填)

4. 这条 alpha 在我们这边该怎么读

4.1 不要把它读成“预测市场很神奇”

它不是在预测谁会赢,而是在交易:

> 一个临近到期、结算规则清晰、概率解释明确的合约,是否还没有把 leader 价格发现 fully price in。

也就是说:

4.2 它更像哪类传统 desk 思路

如果翻成更熟悉的 desk 语言,它更接近:

所以它不是游离主题,反而能和我们现有这些材料形成互证:

4.3 这条线真正的脆弱点是什么

repo 给了完整 skeleton,但脆弱点也很清楚:

  1. maker fill risk:挂单如果 8 秒内不成交,edge 可能已经没了;
  2. binary 订单簿薄:1.2% edge 看着不小,但盘口深度可能不够;
  3. late-window 竞争极强:越靠近 expiry,越容易被更低延迟对手吃掉;
  4. paper/live 差异可能大:README 自己也要求先积累 200+ paper trades 再谈 live;
  5. AI 过滤器不应当先信:当前实现先天更像 overlay,而且 source 顺序还有明显疑点。

5. 对 1m / 3m / 5m / 15m 的可迁移性

5.1 直接可迁移

5.2 不能硬搬的部分

所以要老实写:

> 这是一条可以独立交易的 raw alpha,但它不是“直接复制到 perp 里就还是同一条 alpha”。

对 perp 更合理的读法是:

6. 最小可复现实验(先做什么)

实验 A:纯复制 repo 的最小 paper 版(优先级最高)

目标:先验证 不靠 AI 的 final-window lag arb 有没有正向 expectancy。

#### 数据

#### 规则(先别发明新东西)

#### 指标

实验 B:把它转成我们 desk 的 transfer test

目标:判断 Polymarket lag 是否能反过来当 crypto 短周期外部确认。

做法:

7. 这轮研究后,我会怎么排优先级

值得马上做

  1. final-window lag arb paper logger
  2. maker fill-rate / depth / edge decay 统计
  3. 5m vs 15m 分组
  4. 禁用 AI 的纯规则版复现

先别急着做

  1. AI ensemble filter
  2. event scanner
  3. politics / sports 非 crypto 事件市场
  4. 大量 live 参数优化

原因很简单:

> 当前最需要回答的,不是“AI 能不能再多加 3% 胜率”,而是“base alpha 在扣完真实执行以后,到底还有没有边”。

8. 一页结论

如果只留一句:

> 这份 2026 新 repo 真正该 intake 的不是 AI,而是一条完整、可直接 paper trade 的 5m/15m raw alpha:Binance 先动、Polymarket final-window 赔率后动,用 maker-first 的方式去吃 hard-expiry binary 的 lag-repair。

对当前 desk 的意义:

9. 来源与链接

主来源(repo)

  1. andiyusanto (2026), *Polymarket Latency Arbitrage Bot (v5)*, GitHub repository

公共数据 / 接口路径

  1. Polymarket CLOB API
  1. Polymarket Gamma API
  1. Binance market data streams
  1. Chainlink Data Streams / RTDS(repo 对齐用)