← 返回 Quant Digests · 站点首页

别把这份 HyperData Terminal 只读成鲸鱼看板:对 short-cycle desk,更该先测的是「recent-trader whale-position imbalance × short-horizon follow」这条 raw alpha

更新时间:2026-04-13 18:39 UTC 研究时间:2026-04-13 18:37 UTC 类型:2026 GitHub repo source audit(`README.md` + `src/data_layer/position_scanner.py` + `src/strategies/examples/whale_follow.py` + `src/strategies/base.py`)+ Hyperliquid public API live probe 主题标签:raw-alpha/event-driven/positioning/whale/open-position-imbalance/recent-trader-discovery/hyperliquid/public-wallets/liquidation-distance/state/direction-follow/short-horizon/1m/3m/5m/15m/repo/public-data/cost/risk 证据类型:源码规则 + 公共接口 live sample + desk-level strategy reframing

源文件:research/quant_digests/2026-04-13_1837_recenttrader-whaleposition-imbalance-alpha.md

1. 先把一句话说清楚:这篇东西的 base alpha 是什么?

> base alpha = recently-active public-whale position imbalance → short-horizon continuation。

不是“看见鲸鱼就跟”。 也不是“看见 liquidation map 就猜一定要爆仓”。

这份 repo 里真正适合 desk 拿来做最小实验的,不是 whale_follow.py 那个教学版“盯最大一笔仓位、方向一致就下单”,而是它背后的更有用结构:

  1. 先用 recentTrades 找到刚刚还在市场里活跃的地址;
  2. 再用 clearinghouseState 把这些地址的 open positions 拉出来;
  3. 对单个标的做“净多/净空 notional 失衡”聚合;
  4. distance-to-liquidation 当成状态变量,判断这是“从容持仓的方向信息”,还是“临近清算的挤压燃料”。

翻成人话:

2. 这次看了什么

主来源(repo)

本轮直接审的关键文件

本轮自建 probe 产物

3. 一句话核心结论 + 一句话证明方式

一句话核心结论

> repo 表面上给的是一个很幼稚的“largest whale 跟单示例”,但真正值得 desk 收下的,是“recent-trader address discovery → open-position imbalance → liquidation-distance state split” 这条可独立复现的 raw alpha 壳。

一句话证明方式

> 证明不靠 README 口号,而是靠源码路径本身:recentTrades 发现地址、clearinghouseState 拉仓位、distance_pct 算清算距离;我再用公共接口 live probe 复核后发现,仅从 BTC/ETH/SOL/DOGE 最近成交地址就能映射出 40 个活跃地址、633 个 open positions,其中 BTC 单标的已能聚出 ~2191 万美元 gross notional,且净暴露明显偏空。

4. 为什么这轮值得写,而不是继续做 funding / basis / pairs / 又一个 order-flow 题

因为它补的是当前 digest 池里相对缺的一类素材:

  1. 这不是 funding/basis/pairs 的重复变体。
  1. 它不是单纯“看板数据”。
  1. 它和现有 short-cycle 主线有直接关系。

5. repo 真正提供了什么

5.1 position_scanner.py 才是核心,不是示例策略本身

src/data_layer/position_scanner.py 这份文件比 whale_follow.py 更重要。

它做了 4 件关键事:

  1. 地址发现
  1. 仓位抓取
  1. 清算距离状态化
  1. 最近成交地址 + 当前持仓 的连接

这条链路已经足够形成一个完整 research shell。

5.2 whale_follow.py 本身太幼稚,但正因为幼稚,反而好拆

教学版示例逻辑非常直接:

源码自己都写了: > Educational example — not real trading alpha.

但这不是坏事。 它反而明确告诉我们:

5.3 base.py 把落地接口定义得够清楚

Signal(symbol, action, size_usd, confidence, reason) 这种接口很朴素,但已经足够对应 desk 口径:

所以这不是只能做 dashboard 的 repo; 而是 已经可以很快挂上 paper trading / replay / execution simulator 的研究底座。

6. 我做的 Hyperliquid public API live probe:最关键的数字

6.1 数据与口径

  1. BTC / ETH / SOL / DOGE 的最近成交里发现地址
  2. 截断到最近 40 个活跃地址
  3. 拉这些地址当前 open positions
  4. 聚合单标的 gross / net notional 与 liquidation-distance 分层

6.2 先记最重要的 6 个数

数 1:只用 4 个种子市场,就发现了 40 个最近活跃地址

这说明最小实验的数据入口并不稀缺,公开接口本身就足够先做研究。

数 2:这 40 个地址映射出了 633 个 open positions

这点很关键: 我们抓到的不是“几条零碎地址标签”, 而是一层可以持续扫描的 公开持仓图谱

数 3:BTC 单标的就有 21 笔仓位、$21.91m gross notional

具体到 BTC:

翻成人话: > 这一刻的“最近活跃公开地址”样本里,BTC 明显是净偏空的。

数 4:最大单笔 BTC 仓位就是一笔 ~$15.69m 的空单

probe 里最大的 BTC 仓位是:

这说明两件事:

  1. repo 那种“直接跟最大一笔”的逻辑,样本上确实会得到很强的单边信号;
  2. 但这笔仓位离 liquidation 很远,它更像 conviction position,不像 imminent squeeze fuel。

数 5:BTC 的 within_5pct notional 只有 ~$3.15m

也就是说: > 这个时间点上,BTC 的公开活跃地址样本并不是“马上要爆的大拥挤仓位”,而更像“方向偏空、但离清算还远”的持仓状态。

这恰好支持前面的拆分:

数 6:不只 BTC,ETH / SOL 也同样出现明显净空暴露

probe 前几大标的摘要:

这意味着更值得测的不是“单地址神话”,而是: > 同一批最近活跃地址,是否会在多个大币上同步形成方向性持仓失衡,并对后续 5m/15m 产生可交易的 drift。

7. 这条线对 short-cycle desk 的正确读法

7.1 它是 raw alpha,不是 overlay

原因很简单:

所以它应归类为: > event-driven / positioning raw alpha

7.2 但不要照抄“largest whale blindly follow”

repo 自带示例太粗:

更合理的 desk 版,至少要升级为:

7.3 更像哪类完整策略?

更像下面这条壳:

  1. 发现地址:1m 更新最近活跃地址池
  2. 聚合方向: 对每个币算 net_notional = long - short
  3. 做 admission: 只做 gross notional 足够大、地址数足够多的币
  4. 做状态划分:
  1. 执行: 在 Binance / Hyperliquid 自己的 1m/3m/5m/15m 上做子执行

8. 下一步怎么测(必须项)

8.1 先做最小可复现实验,不要先做复杂回测系统

第一步不是上生产框架,而是先回答一个最基本的问题:

> recent-trader basket 的净持仓失衡,到底能不能预测后续 5m / 15m 收益方向?

最小实验建议:

  1. 每分钟抓一次:
  1. 对每个 symbol 生成 3 个主特征:
  1. 预测 future returns:
  1. 先只看最朴素分桶:

8.2 第一版策略壳

如果最小实验有方向性,就先做最简单版本:

8.3 第二版再考虑与现有书架拼接

如果 raw alpha 本体成立,再去做这些增强:

顺序别反。 先确认 raw alpha 本体,再谈 overlay。

9. 当前 verdict

> 值得进研究池,而且应该按 raw alpha 立项。

但要非常明确:

如果这条线后续成立,它会给 desk 补上一块目前还不算拥挤的素材:

这对 1m / 3m / 5m / 15m 的 short-cycle 研究,是真正值得补的一条新 raw alpha 线。

10. 来源