您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架 - 发现报告

Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架

2025-11-25 高智威 国金证券 朝新G
报告封面

从SSM, Mamba到Mamba2模型 本文创新性地将Mamba-2模型加入整体模型架构,该模型通过SSD把SSM计算重写为矩阵乘+少量结构化算子,既继承Mamba的“选择性状态压缩”,又在系统层面获得与GPU硬件高度匹配的输入输出优势,形成“表达力-效率-可扩展性”的三重平衡。对需要超长上下文、吞吐敏感且部署成本受限的应用场景(语音/时间序列/金融高频等),Mamba-2提供了优于纯注意力与传统RNN/SSM的解法与性价比。 Mamba2模型与GRU选股效果比较 我们分别选取了10分钟、30分钟、60分钟、一日四种不同频率的基础量价数据,在相同数据与回测框架下,对比Mamba2与经典GRU模型的选股效果。结果表明,Mamba2模型只有在日频数据上整体表现明显优于GRU模型,60分钟频上与GRU模型不分伯仲,30分钟频上能够带来沪深300的优化。但相关性测算显示GRU与Mamba2在不同频率的“截面信号”相关性约70%–80%,这意味着二者并非冗余:通过模型-频率的合成(如日频+60分/30分、GRU+Mamba2)有望带来增量信息与风格分散。 模型合成与宽基指增策略 在构建模型前,我们构造了三类个股不变的市场信息(三大宽基指数点位、当前交易日的时间信息、基于Barra因子构建的市场风格指数)作为附加输入。结果显示:三大宽基指数信息的提升最为显著,IC、多头多空收益与回撤指标均明显改善;时间信息与Barra风格信息在GRU上并未带来稳定增益。 根据以上所有探讨,我们构建了“GRU(4频)+Mamba2(3频)+GJQuant因子→LGBM”的二层合成架构,并在GRU4频输入基础上引入三大宽基指数点位信息。从合成结果看,加入Mamba2后IC、多头超额等维度表现较之GRU基线提升明显,再叠加LGBM进一步提升;当三者联合并引入GJQ因子库后,各个维度表现进一步提升至最佳。更关键的是,多空年化收益率与夏普比率在合成后持续抬升,而多空波动率并未同步放大,说明合成带来了真实Alpha增量而非来源于杠杆放大。 据此搭建的三大宽基的指数增强策略均取得显著超额,沪深300、中证500、中证1000指增策略的年化超额分别达到9.99%、12.20%和20.65%,信息比率分别为1.88、2.24和3.31;最大回撤方面,三者的主动层回撤均显著小于指数本身。总体来说,合成架构表现优异。风险提示 1、以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。 2、策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。 内容目录 一、从SSM, Mamba到Mamba2模型..................................................................41.1结构化状态空间模型(SSM):从连续系统到可并行计算........................................41.2 Mamba:选择性SSM与RNN/Transformer之间的效率-效果折衷..................................41.3 Mamba-2:以SSD(半可分离矩阵)实现张量并行友好的SSM....................................5二、Mamba2模型与GRU选股效果比较...............................................................6三、模型合成与宽基指增策略.....................................................................113.1引入3种市场整体信息...................................................................113.2收益率长尾分布与损失函数的选择.........................................................133.3模型合成框架:频率×模型×传统因子三线并进.............................................143.4宽基指数增强策略.......................................................................16总结...........................................................................................17风险提示.......................................................................................18 图表目录 图表1:结构化状态空间模型(SSM)..............................................................4图表2:结构化状态空间模型图解.................................................................4图表3:离散化的状态空间模型...................................................................4图表4:卷积化的状态空间模型...................................................................4图表5:Mamba模型与Transformer和GRU的区别....................................................5图表6:Mamba2矩阵分解方法.....................................................................5图表7:SSD与Attention和SSM的比较............................................................6图表8:Mamba2相对Mamba1结构的改进............................................................6图表9:日频OHLCV输入GRU和Mamba统计数据比较.................................................7图表10:日频OHLCV输入GRU和Mamba全A多空净值................................................7图表11:60分钟频OHLCV输入GRU和Mamba统计数据比较............................................8图表12:60分钟频OHLCV输入GRU和Mamba全A多空净值............................................8图表13:30分钟频OHLCV输入GRU和Mamba统计数据比较............................................9图表14:30分钟频OHLCV输入GRU和Mamba全A多空净值............................................9图表15:10分钟频OHLCV输入GRU和Mamba统计数据比较...........................................10图表16:10分钟频OHLCV输入GRU和Mamba全A多空净值...........................................10图表17:各频率因子之间相关性.................................................................11图表18:构建的3种个股不变的市场信息.........................................................11 图表19:加入市场信息GRU在全A的表现.........................................................12图表20:加入市场信息GRU全A多头超额净值.....................................................12图表21:GRU+指数在沪深300的表现.............................................................12图表22:GRU+指数在沪深300多头超额净值.......................................................13图表23:不同损失函数尝试.....................................................................13图表24:不同损失函数全A统计数据.............................................................13图表25:因子合成框架.........................................................................14图表26:因子合成效果.........................................................................14图表27:不同来源的因子重要程度...............................................................15图表28:Barra因子截面相关性..................................................................15图表29:Barra因子暴露(累加)................................................................16图表30:宽基指数增强统计数据.................................................................16图表31:沪深300增强净值.....................................................................17图表32:沪深300增强分年度数据...............................................................17图表33:中证500增强净值.....................................................................17图表34:中证500增强分年度数据...............................................................17图表35:中证1000增强净值....................................................................17图表36:中证1000增强分年度数据...................