← 返回 Quant Digests · 站点首页
别把这篇 2026 Pump.fun 论文只读成“毕业概率说明书”:对 short-cycle desk,更该先测的是「同一 `vSOL` 下的快路径 launch alpha」
更新时间:2026-04-03 13:53 UTC
研究时间:2026-04-03 13:55 UTC
类型:论文 / 公开链上数据
主题标签:raw-alpha/event-driven/launchpad/pumpfun/solana/onchain/microstructure/flow-velocity/graduation-probability/bot-share/long-only/1m/3m/5m/public-data/paper/cost/risk
证据类型:2026 arXiv 论文 HTML source audit + Pump.fun 公开机制 + Solana 链上可观测交易日志口径
源文件:research/quant_digests/2026-04-03_1355_pumpfun-fastpath-graduation-alpha.md
- 时间:2026-04-03 13:55 UTC
- 类型:论文 / 公开链上数据
- 主题类型:raw alpha
- 基础 alpha:同一条 Pump.fun bonding curve 上,若新币在早期以更少成交笔数、更低 bot 占比、更健康的参与者结构快速累积
vSOL,其后续“继续吸引资金并冲向 graduation”的概率显著更高;可把它做成一个 launch-phase long-only event alpha,而不是把 vSOL 本身误当成充分信号。
- 是否可独立复现:是
- 是否可直接落地完整策略(entry/exit/sizing/risk/cost):是
- 主题标签:raw-alpha/event-driven/launchpad/pumpfun/solana/onchain/microstructure/flow-velocity/graduation-probability/bot-share/long-only/1m/3m/5m/public-data/paper/cost/risk
- 证据类型:2026 arXiv 论文 HTML source audit + Pump.fun 公开机制 + Solana 链上可观测交易日志口径
1. 这次看了什么
这轮补一个和最近 perp pairs / funding / cross-venue 线不一样,但仍然是可独立复现的 raw alpha:Marino、Naviglio、Tarantelli、Lillo 在 2026 年的新论文 _Predicting the success of new crypto-tokens: the Pump.fun case_。
一句话先说清这篇东西的 base alpha:不是“某个 memecoin 会不会成功”这种叙事判断,而是“同样走到某个 bonding-curve 状态时,哪类 token 更容易继续吸到资金并冲向 graduation”。对 short-cycle desk 来说,真正该抄的不是“毕业概率曲线”本身,而是其背后的 path-dependent flow alpha:同样的 vSOL,快路径比慢路径更值钱;低 bot 污染路径比高 bot 污染路径更值钱。
这条线之所以值得进池子:
- 它是 raw alpha,不是纯解释型综述;
- 数据公开可拿,链上逐笔可回放;
- 频率天然足够高,虽然不一定是传统
5m/15m perp,但非常适合 1m/3m 的高强度事件驱动实验;
- 能拆成完整策略:
entry / exit / sizing / cost / dump veto 都能落地。
2. 核心结论
- 这篇东西的 base alpha 很清楚:launch-phase continuation / graduation continuation,不是 filter 伪装成 alpha。
- 样本非常大:作者抓了 2025-09-01 到 2025-10-01 的 Pump.fun 全量新币,合计 655,770 个 token;其中只有 4,338 个毕业,毕业率约 0.63%。这说明“随便冲”几乎一定死,必须做强筛选。
- 论文给出一个非常有用的经济学 sanity check:如果你在某个
vSOL 水位买入并持有到 graduation,最粗糙的 break-even 条件是
p(grad | features, vSOL) > (vSOL / 115)^2。
- 这意味着:
vSOL=30 时至少要 6.8% 的毕业概率才勉强打平;
vSOL=50 时要 18.9%;
vSOL=80 时要 48.4%;
vSOL=100 时要 75.6%。
- 只看
vSOL 自身还不够。论文明确说:仅靠 baseline vSOL 曲线,做 naive buy-and-hold 是过不了 break-even 的。 真正有用的是附加条件。
- 最强附加条件不是“明星钱包”,而是流动性积累速度:在相同
vSOL 下,用更少成交笔数冲到该水位的 token,毕业概率明显更高;作者直说它是全文里最有信息量的 predictor。
- bot 结构也有用。作者表格给出的 out-of-sample 结果里:
- 当 token 至少到过
vSOL ≥ 80,baseline 毕业概率约 35.4%;
- 若再要求非 bot 交易占比 > 30%,概率升到约 43.6%;
- 当 token 至少到过
vSOL ≥ 100,baseline 约 63.8%;
- 加上同样的非 bot 条件后升到约 74.8%。
这说明“谁在参与这段上涨”确实重要,不是只有资金量重要。
- 论文还提醒了一个很关键的现实:creator/早期钱包的 dump 在这个生态里非常常见。 在满足最少 30 笔成交的样本里,作者用稳健 Shewhart 规则检测到 92.22% 的 token 至少出现过一次 dump 事件。也就是说,这条 alpha 能做,但不能把 exit 写得太天真。
3. 为什么和当前项目有关
如果继续只补 perp trend / breakout / pairs,会慢慢形成素材池偏科;这篇东西补的是一个此前素材池里相对缺的“一级发行 / launchpad / bonding-curve 微观结构 alpha”方向。
它和当前 desk 的直接关系在于:
- 给 raw alpha 素材池补一条事件驱动型支线,而不是再补一个泛 filter;
- 可与我们已有的
OFI / bot-flow / microstructure / liquidity gate 框架共用很多实现件;
- 即使最后不做 Pump.fun,也能迁移到其他launchpad / AMM 初期价格发现场景;
- 对
1m / 3m 尤其友好:不是等 K 线走完,而是等路径特征成形。
3.5 策略拆解(必填)
- 方向属性:event-driven / launch continuation / microstructure raw alpha
- 基础 alpha:同一
vSOL 水位下,资金积累更快、bot 污染更低、参与者结构更健康的 token,更可能继续完成 graduation;可做 launch phase continuation。
- regime:只在 Pump.fun / 类似 bonding-curve launchpad 的活跃时段有效;SOL 主链拥堵、手续费异常、链上拥堵严重时应降权。
- filter / veto:必须过滤极端 bot 污染、成交笔数过慢、creator dump 信号、极端单钱包控盘、超快不可成交 token。
- risk / sizing / execution overlay:长仓 only;极小单名义;分散到一篮子事件;触发 creator-dump / 急速回撤 / 时间超限就强平;不要用“持有到毕业”当唯一 exit。
4. 可复刻的最小实验
4.1 研究假设
如果我们用公开 Solana 链上数据重建 Pump.fun token 的 launch 早期路径,那么在相同 vSOL 阶段,低 trades-to-vSOL + 低 bot share + 非单钱包挤出来的流入 的组合,应当显著提高后续 1~15 分钟继续上冲 / 逼近 graduation 的概率与风险调整收益。
4.2 先别做太花,最小版这样切
Universe
- 标的:Pump.fun 新发 token
- 样本:最近
30 天或 60 天
- 事件起点:token creation 后前
15 分钟
状态变量
vSOL_now
n_trades_to_now
bot_share_to_now
unique_wallets_to_now
top_holder_share(若拿得到)
creator_related_wallet_sell_flag(若拿得到)
最小入场规则(v1)
- 只看 token 第一次达到
vSOL ∈ [30, 50] 的时刻;
- 要求
n_trades_to_now <= 50 或落在当日同批 token 的前 20% 快路径分位;
- 要求
bot_share_to_now <= 70%(更保守可直接要求 non-bot > 30%);
- 要求最近
60s 无单钱包大额 dump;
- 满足则在下一笔可成交价格或下一根
15s/1m bar 进场。
最小出场规则(v1)
TP1:到达 vSOL=80 / 100 分段止盈;
TP2:接近 graduation 前分批减仓,不强求吃满最后一段;
SL1:出现 creator/关联钱包 dump 特征立即走;
SL2:入场后 3m / 5m 内 vSOL 不再创新高则时间止损;
SL3:价格自入场高点回撤超过阈值(例如 12%~15%)则止损。
4.3 成本口径
这条线一定要老实:
- Pump.fun 虚拟曲线阶段每次 swap 有 1.25% fee;
- 论文的 break-even 推导还忽略 gas 与额外摩擦,所以真实门槛只会更高;
- 若没有链上实际成交明细与滑点模型,任何纸面收益都很容易偏乐观。
4.4 先看 4 个指标
conditional_grad_prob:按 vSOL bucket × speed bucket × bot-share bucket 统计后续毕业率
entry_to_exit_return_net_fee
max_drawdown_before_exit
creator-dump hit-rate after entry
4.5 下一步怎么测
- 先复现论文最核心的两层条件:
vSOL + trades_to_vSOL,确认“快路径优于慢路径”在你自己的链上重建口径里也存在;
- 再加
bot_share,检验它对 vSOL≥80 和 vSOL≥100 区间是否真有 uplift;
- 把“毕业”目标改成更贴 desk 的短持有目标,例如:
未来 1m/3m/5m 最大上冲幅度、是否在 5m 内继续冲到下一档 vSOL;
- 最后单独做 dump veto:入场后若出现 creator wallet/cluster 的异常集中卖出,策略收益是否明显改善。
5. 为什么这篇值得、但也不能过度神化
值得的地方
- 论文直接告诉你:别把
vSOL 当充分条件,路径本身才是 alpha。
- 数据是公开链上原始数据,不是黑箱 vendor;
- 可直接复现成事件驱动完整策略,而不是停在“解释一个现象”。
保留意见
- 这条线更像 launchpad 特化 alpha,不是通用 perp alpha;
- raw alpha 成立不代表容易实盘,因为手续费高、滑点高、失败率极高;
- 论文里的经济学 break-even 仍然过于乐观,因为它默认“失败就归零、成功就卖到毕业”,但没把所有现实摩擦和可成交性细节吃进去;
- “成功 trader” 这类变量有一定实现复杂度,且论文自己也承认不如 liquidity velocity 稳健;
- 生态中 dump 极多,所以exit 设计的重要性不低于 entry。
6. 我对 desk 的实际建议
如果真要把它推进到研发队列,建议不要一开始就做全量复杂模型,而是按下面顺序:
- 先做快路径二分类:
same vSOL, fewer trades wins?
- 再做 bot-share 条件增强;
- 然后把目标函数从“毕业”替换成更近端、更可交易的 1m/3m/5m follow-through;
- 最后才补 creator cluster、钱包画像、图聚类这些重特征。
换句话说,先证明“路径速度”本身能赚钱,再去加更花的链上身份特征。
7. 来源
- Giulio Marino, Manuel Naviglio, Francesco Tarantelli, Fabrizio Lillo. (2026). _Predicting the success of new crypto-tokens: the Pump.fun case_. arXiv, q-fin.ST.
- Pump.fun Documentation / Platform mechanism (2026 access).
- Venue: Official Docs / Platform
- DOI: N/A
- Readable URL: <https://pump.fun>
- Repo URL: N/A
- Solana RPC / transaction log data (2026 access).