源文件:research/quant_digests/2026-04-11_1353_sparse-lagvote-nextbar-alpha.md
1m/3m/5m portability probenext-bar long/short,并用极短 time-box 出场。主论文是:
10.5750/jpm.v15i1.1840Crossref / OpenAlex / ScienceOpen 能稳定拿到的核心摘要是:
> 作者用一大组线性与非线性 predictor,对 10 个主流加密货币的 1-minute ahead returns 做 LASSO 预测;结果显示 LASSO 的 out-of-sample 预测优于 benchmark,而且被选中的 predictors 很 sparse,而且很 short-lived。
这篇东西最容易被读成一句空话:
> LASSO 在 minute 数据上有点用。
但对我们 desk 真正有用的,不是“机器学习又赢了”,而是它明确给了一个 可独立成策略的 raw alpha 骨架:
> 不是持续持有某个慢频因子,而是每分钟重新问一次:当前有没有极少数、但仍然活着的 lagged signal,足够支持下一根方向单。
一句话核心结论:
> 别把这篇 paper 只当 ML 比赛;更该先测的是「sparse lag-vote × next-minute sign」这条 1m raw alpha。
一句话证明方式:
> 论文只给出“稀疏且短命”的抽象结论;我再补一个 Binance USDⓈ-M 1m portability probe,把它翻成可交易壳:对 9 个 liquid futures 用 lagged return / vol / volume 特征做 rolling-ish Lasso,看 strongest predictions 在 1m/3m/5m 上是否真能留下 first-pass edge。
它和已有材料不完全一样:
5m/15m 的趋势壳;它真正要补的是另一类 short-cycle 原语:
> 信号本身很短命,所以持有期也必须很短;若拉长到 3m/5m 甚至做成宽松 cross-sectional long-short,edge 反而会被自己摊薄。
所以它的 base alpha 很清楚:
> 下一分钟收益,可以被一小撮 lagged own/cross-asset features 条件化预测。
这不是 overlay,不是 filter;它本身就是一个可以定义入场、出场和成本门槛的 directional raw alpha。
摘要里最重要的词不是 LASSO,而是:
翻成人话:
> 不是市场里一直躺着一堆稳定 alpha 等你捡,而是每个时刻真正有信息量的特征可能只有几根。
这对 desk 的启发很直接:
摘要里写的是 1-minute ahead out-of-sample return forecasts。
这句话交易上非常关键:
1h 级别风格暴露;所以如果要搬到 desk,最自然的版本是:
|pred| 超过阈值时开仓;1m 后优先平,3m 是容忍上限,5m 已经应该高度怀疑 alpha decay。这篇 paper 没有给我们一个可以死背的固定因子表;它给的是一种更接近 production 的思路:
> 同一套 feature 库里,真正该活跃的 predictor 会变化;重要的不是把 100 个特征全吃进去,而是让模型在当下只留下少数 still-alive 的那几个。
这很适合 short-cycle desk,因为很多分钟级 alpha 的真实问题都不是“没有 feature”,而是:
1m 可交易骨架我做了一个非常克制的最小实验,只检验这条线最核心的 desk 版本能否活:
BTCUSDT, ETHUSDT, BNBUSDT, XRPUSDT, ADAUSDT, SOLUSDT, DOGEUSDT, LINKUSDT, LTCUSDT1mret_l1/l2/l3/l5/l10/l15/l30mom_5/15/30/60rv_5/15/30/60volume-z style 特征LassoCV|pred| 进入该资产测试期 top 10% 时,按预测方向做 next-bar directional trade本地 artifacts:
/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_asset_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_xs_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_xs_quantile_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_top_features_2026-04-11_v2.csv最干净的两个 first-pass 结果是:
|pred| 事件数:301LINK / SOL 也有轻微正值,但幅度更弱;ETH / DOGE 反而转负。
这组数说明两件事:
3m/5m 很快衰减甚至翻负我额外做了一个很朴素的 cross-sectional top-bottom 版本:
1m/3m/5m 的均值表现。结果非常直白:
换句话说:
> 这条线更像“下一分钟 directional micro-edge”,而不是可直接拉长成 3m/5m 的广义横截面书。
这反而和论文里的 short-lived 完全一致。
如果把预测值按分位数做得更宽(例如每分钟都拿 top20% / bottom20%),结果也不漂亮:
1m 有一点点正均值(约 +0.069 bps)3m/5m 还是转负所以这条线真正的可交易版本,不应是:
> 每分钟都做一个横截面轮动组合
而更应是:
> 只拿 strongest minute forecast,做 very short hold directional shell。
从 ...top_features_2026-04-11_v2.csv 看,最有意思的是:
BTC 被选中的前几项大致是:
BTCUSDT_ret_l1:负ADAUSDT_ret_l1:负SOLUSDT_mom_60:正XRPUSDT_rv_5:正SOLUSDT_ret_l10:正翻译一下:
> BTC 的 next-minute sign,不像纯粹 trend-follow;它更像“自身体内 1-lag 反打 + 其他大币慢一点的 state/context 修正”。
LTC 前几项包括:
BNBUSDT_ret_l1:负LTCUSDT_ret_l3:负XRPUSDT_mom_60:正SOLUSDT_ret_l10:正这也很像:
> 快的那部分是短 lag mean reversion;慢的那部分是 cross-coin state confirmation。
所以如果要把这条线翻成 desk 语言,更接近:
> very short-horizon sign fade / sign-confirm hybrid,而不是单纯的 momentum 或单纯的 reversal。
按当前 probe,最合理的第一版不是 cross-sectional long-short,而是:
BTC / LTC / 也许再加 LINK 这类 first-pass 还活着的合约;|pred| 最大那部分分钟;3m 只是容忍延迟,不是默认持有期。当前结果里,最值钱的不是平均 OOS corr 有多大,而是:
> 当预测值强到某个分位阈值时,next-minute signed bps 是否抬起来。
这说明 production 版更该重视:
|pred| threshold3m/5m 搬,先别想持有更久,先想如何把 1m signal 聚合成 burst现在的 portability probe 已经告诉我们:
pred spike + liquidity ok + spread ok 才进;|pred| 不到阈值不做;spread / taker cost / funding boundary / 异常波动分钟不做|pred| 分层 sizing;1 bar 默认 time-stop;连续亏损分钟触发 cooldown;总成交频率设上限防 churn这条线很适合补当前素材池里的一个缺口:
它的价值不只是独立交易,也能服务别的 alpha:
但基于这轮 probe,我会明确把它定位为:
> raw alpha 本体可独立存在,但更适合先做成“ultra-short directional shell”,不是先做 broad XS factor。
1m> 若下一分钟收益真的只受少量、短命的 lagged predictors 影响,那么在 liquid majors 上,Lasso 这类稀疏模型应能筛出少量 nonzero features;在 strongest prediction bucket 里,future 1m signed return 应显著好于 0,而这类 edge 在 3m/5m 上会明显衰减。
BTCUSDT / LTCUSDT / LINKUSDT1m|pred| >= 90% quantile 入场1m2 / 4 / 6 bps这条线下一步别做大,先做准:
BTC/LTC/少数 majors 有 first-pass edgesingle spike vs 2-bar confirmationpred spike + spread vetopred spike + OFI 同向如果 executable 版本在 BTC/LTC 这类高流动合约上,扣完 2~4 bps 后 strongest 1m 信号仍是正的,这条线就能进入 clean replication;如果一上真实成交成本就塌,那它仍然值得保留为 minute-level confirmation / veto layer,而不算白做。
/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_asset_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_xs_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_xs_quantile_summary_2026-04-11_v2.csv/root/clawd/jerry/momentum/reports/artifacts/literature/sparse_intraday_lasso_probe_top_features_2026-04-11_v2.csv