← 返回 Quant Digests · 站点首页

Hyperliquid whale-trade convergence continuation alpha

更新时间:2026-04-01 03:25 UTC

源文件:research/quant_digests/2026-04-01_0325_hyperliquid-whale-trade-convergence-alpha.md

> 一句话先定性:这不是“看见 whale 就跟单”的段子版 copy trading;更像是把 公开钱包地址 + 大单门槛 + 5 分钟同向收敛 + 组合风险壳 拼成一条可直接上最小实验的短周期 raw alpha。

1. 为什么这轮值得写

这轮我优先选它,不是因为又来了一个“多策略 bot”,而是因为这份 2026 新仓库 里真正最适合 desk 的,不是 funding sniper,也不是 liquidation rider,而是 Whale Tracker 这条可以独立拆出来跑的 raw alpha:

  1. base alpha 说得清:大额 aggressor trade / 高分钱包同向聚集 → 短时 continuation。
  2. 公开可拿数据:Hyperliquid 公共 WebSocket trades 流直接给 coin / side / px / sz / time / users,其中 users 就是买卖双方地址。
  3. 策略壳完整:repo 里不仅有 entry,还有 confidence、sizing、TP/SL、相关性桶限额、反向信号平仓。
  4. 时间尺度天然贴近 desk:事件级触发 + 300s 收敛窗,本来就是 1m/3m/5m 语境,不需要硬把日频论文掰成分钟线。

所以,这轮它比继续补一个纯 filter / 纯 veto 更值钱。

---

2. 本次主源与证据类型

主源 A:2026 GitHub 仓库(核心)

主源 B:Hyperliquid 官方 WebSocket 文档(数据公开性)

辅助地基(微观结构为什么有可能成立)

  1. Easley, López de Prado, O’Hara (2012), *Flow toxicity and liquidity in a high-frequency world*, *Review of Financial Studies*, DOI: 10.1093/rfs/hhs053.
  2. Wen, Perez, Livan, Caccioli (2023/2024 working-paper line), *Cross-Market Intraday Time-Series Momentum*, SSRN readable URL: <https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4080253>.

> 这里地基不是说“whale wallet = 必赚”,而是说:短时订单流本来就会携带信息,而且跨账户/跨参与者的同向聚集,通常比单笔 isolated print 更有意义。

---

3. Repo 里真正可拿来做 alpha 的部分

3.1 原始触发:不是所有 trade,都算 whale activity

hlbot/strategies/whale_tracker.py 里的核心阈值非常直接:

也就是说,单笔交易要先过 $50k notional,而且发起方地址必须已经在 tracked whales 里,且该地址得分 >= 0.6,才会生成原始信号。

这个设计有两个好处:

  1. 先过滤掉大量“小地址大惊小怪”。
  2. 把策略重心从“绝对大单”改成“历史上更值得信的人打出来的大单”。

这比单纯看 sz 或单次 liquidation event 更像一个可持续 raw alpha admission layer。

3.2 真正值钱的是“同向收敛”,不是孤立巨单

repo 不是机械地“见大单就追”,而是额外统计:

convergence > 1,就给 signal confidence 再加 +0.15,上限到 0.95

这一步非常像我们 desk 更关心的东西:

> 不是单个账户一脚踹出去,而是多个独立账户 / 多次可归因大单,在很短时间内把同一方向确认出来。

这比很多“单点 whale alert”更接近可以复现的短周期 alpha。

3.3 钱包分数不是拍脑袋,是可滚动更新的

repo 的 wallet score 机制虽然简陋,但足够形成最小可用版本:

这意味着 repo 默认承认一个现实:

> whale 不是静态白名单,而是动态 ranking。

对 desk 来说,这很重要,因为真正该测的不是“神秘地址列表”,而是 地址分层 + 活跃度再加权 这套 admission stack。

---

4. 这条策略怎么落成完整交易规则

下面把 repo 里分散的逻辑合并成我们真正能跑的完整策略。

4.1 Entry

Long entry

满足以下条件时开多:

  1. 公共 trade stream 中出现 size_usd >= 50k 的买向 aggressor trade;
  2. 买方地址在 tracked whales 中;
  3. 该钱包 score >= 0.6
  4. 过去 300 秒内,同资产同方向 distinct whale 数量越多越好;若 >1,confidence 再加 0.15
  5. 资产不违反组合相关性桶约束。

Short entry

同理,卖向 whale trade 触发开空。

4.2 Confidence

repo 里的原式:

``text size_factor = min(size_usd / 100k, 1.5) confidence = min(whale_score * (0.5 + 0.3 * size_factor), 0.9) if convergence > 1: confidence += 0.15 (cap at 0.95) ``

翻成人话:

4.3 Sizing

repo 不是固定满仓,而是 Kelly-ish:

这对我们很有借鉴意义:

> 这种“confidence²” sizing,天然抑制中低质量事件冲动开仓,更适合 event-driven raw alpha。

4.4 Exit / risk

repo 已经给了完整壳:

注意: 这套 TP/SL 更像通用 shell,alpha 本体其实在 entry admission。对 1m/3m/5m 实盘化时,TP/SL 大概率要缩窄,不然 holding period 会被拉太长。

---

5. 为什么它对 1m / 3m / 5m / 15m 真有关系

5.1 这条 alpha 天生属于分钟级 event-driven continuation

它不是日频钱包追踪,也不是慢 carry。

它的原始输入是:

所以它天然适合:

5.2 它服务的不是“形态学 breakout”,而是信息流 alpha

这也是这轮值得收进素材池的地方。

base alpha 不是:

而是:

这能补充 desk 当前 raw alpha 池,不会只是旧 breakout 家族内循环。

---

6. 快速 sanity check:公开 live tape 上,这个阈值是不是死的?

我做了一个极小的公开 live probe:

结果摘要

这说明什么

这不是 alpha 验证,只是 cadence sanity check。

结论很清楚:

  1. $50k 门槛是稀疏触发,不是高频信号
  2. 稀疏是好事——更像 event-driven 高 conviction,而不是随时都能开仓的噪音策略;
  3. 若扩到 DOGE/WIF/PEPE 这类低价高活跃币,门槛可能要改成 按 ADV / top-book depth / coin-specific percentile,否则容易“只在 majors 上活着”。

---

7. 真正值得 desk 复现的版本

repo 原版更像一个 live skeleton。对我们来说,更该复现的是下面这个 desk 版:

7.1 Desk 版最小可复现实验(推荐)

Universe

Event definition

对每个 coin 的每笔 trade,计算:

Alpha trigger(第一版)

开多条件:

  1. trade_notional_usd >= coin_specific_threshold
  2. wallet_score >= q80
  3. same_side_distinct_whales_300s >= 2
  4. same_side_whale_notional_300s >= q90
  5. 事件后第一分钟 mid 没有立刻反向吞没

开空同理。

Exit

Cost

7.2 更 desk-friendly 的两条改写

改写 A:把绝对 $50k 改成 coin-specific 百分位

直接测:

好处:

改写 B:把“单 wallet 触发”升级成“群聚冲击分数”

例如:

```text whale_shock_score = z(trade_notional_sum_300s_same_side) + z(distinct_wallet_count_300s_same_side) + z(repeat_wallet_intensity)

这比简单 convergence>1 更适合做 cross-asset ranking。

---

8. 它最可能怎么失效

要提前诚实。

8.1 地址不等于“聪明钱”

有些地址只是内部转移、做市对敲、清算相关流,不是信息交易。 所以钱包分数必须滚动更新,不能迷信固定白名单。

8.2 大单打印可能是冲击末端,不是起点

尤其在 memecoin 上,大单常常是最后一脚而不是开始。 所以最好加:

8.3 组合相关性会让“多币同向开仓”看起来很爽,实际上全是同一笔 beta

repo 用 correlation bucket cap 处理这件事,这是对的。 如果 desk 复现时只看单笔 alpha 而不做组内限额,最后很容易把同一轮市场 beta 当成多次独立胜利。

8.4 费率与冲击成本是第一杀手

这种事件驱动 continuation,最怕:

所以必须区分:

前者成立,不代表后者成立。

---

9. 和当前素材池的关系

这篇最有价值的地方,是它补的是 “公开身份流 + 大单群聚 continuation” 这条 raw alpha 分支,而不是继续围绕:

它与我们已有材料的关系更像:

但本体依然是 raw alpha,不是 filter 假装 alpha。

---

10. 结论

如果把这份 2026 repo 整体阅读,很容易把注意力放在“多策略 bot”。 但对短周期 desk,真正该先拿走的,是里面 Whale Tracker 这一支:

> 公开钱包地址 + 大额 aggressor trade + 5 分钟同向收敛 → 事件驱动 continuation alpha。

它的优点是:

我的判断: 值得进入复现池,而且优先级不低。 但第一轮别急着做“盲目 whale 跟单”,而是先把它改写成 coin-normalized whale shock continuation,并严格核算 taker cost 与事件后吞没率。

---

11. 下一步怎么测(直接执行版)

Step 1:先做数据层

抓 Hyperliquid 公共 trade stream,持续记录至少 7 天:

Step 2:先测最小 raw alpha,不加太多花活

只测:

Step 3:再加成本与执行

分三套:

  1. signal close-to-mid(理想)
  2. taker-on-close
  3. maker-entry / taker-exit

Step 4:最后才加 wallet score

先验证“群聚是否有 edge”,再验证“高分钱包是否进一步抬升 edge”。 不要一上来就做复杂 wallet 评分,把问题搅在一起。

---

12. 本文关键信息卡