您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [财通证券]:金融工程专题报告:基于知识蒸馏的AI选股模型优化 - 发现报告

金融工程专题报告:基于知识蒸馏的AI选股模型优化

金融 2026-05-25 财通证券 华仔
报告封面

金融工程专题报告/2026.05.25 证券研究报告 核心观点 分析师缪铃凯SAC证书编号:S0160525060003miaolk@ctsec.com 我们借鉴大语言模型蒸馏的思想,将知识蒸馏技术应用于量化选股领域,实现选股模型的优化升级。选用一个在全市场具有稳定且较强选股能力的成熟综合选股模型作为Teacher,用其预测值作为蒸馏标签,引导基于不同数据集训练的Student模型学习成熟模型中的收益预测信息,同时保留各自数据集的差异化增量。 相关报告 1.《BETA风格强势,公募指增超额回撤》2026-05-102.《5月配置:关注有色、化工、石油、电新和机械》2026-05-053.《OpenClaw应用:为Agent重构投研信息底座》2026-04-24 ❖蒸馏信号验证:模型蒸馏能够弱化低信噪比数据集的训练难度。在30分钟K线数据集上,原始信号因子多头超额25.4%、5日IC均值9.3%,蒸馏信号因子多头超额提升至34.2%、5日IC均值提升至11.7%;在日频量价特征数据集上,原始信号多头超额25.9%、5日IC均值10.4%,蒸馏信号多头超额提升至32.1%、5日IC均值提升至11.1%。蒸馏信号相比原始信号在多头与IC两个维度均有明显提升。 ❖模型构建:基于“时序LSTM+截面图注意力”基础架构构建Student模型,分钟K线数据先经ResNet降维后进入时序网络,基本面信息在时序网络之后、截面网络之前与隐藏层拼接。以已验证有效的成熟综合选股模型作为Teacher,为蒸馏过程提供高质量监督信号。 ❖蒸馏因子集成:基于5类数据集、按是否融合基本面信息各训练2次,我们共得到10组因子,因子集合之间平均相关性约80%;进一步采用LightGBM、Xgboost、CatBoost三类GBDT模型加权,三类预测结果平均相关性约90%。蒸馏综合因子与基于原始标签训练的基准综合因子相关性约76%,增量信息显著;与Teacher因子值相关性约87%,较好地继承了成熟模型的特征表达。 ❖综合因子绩效:基于蒸馏框架重构的AI综合因子,2021年以来5日IC均值13.0%,多头组合年化超额收益50.0%,相较基准模型提升明显。分域来看,因子在沪深300、中证500、中证1000成分股中的5日IC分别为8.5%、7.7%、10.3%,多头超额收益分别为27.0%、21.0%、27.7%。 ❖指增策略:以综合蒸馏因子作为alpha打分,通过组合优化构建三大宽基指增组合。2021年以来,沪深300指数增强组合年化超额收益12.8%,信息比2.88;中证500指数增强组合年化超额收益15.8%,信息比2.99;中证1000指数增强组合年化超额收益20.1%,信息比3.72。 风险提示:因子失效风险、模型失效风险、市场风格变动风险。 内容目录 1引言...............................................................................................................................................................42知识蒸馏框架...............................................................................................................................................52.1知识蒸馏的基本思想................................................................................................................................52.2蒸馏模型的训练方式................................................................................................................................62.3知识蒸馏的前提........................................................................................................................................63蒸馏信号分析...............................................................................................................................................83.1分钟K线蒸馏..........................................................................................................................................83.2日频量价特征蒸馏....................................................................................................................................94蒸馏选股模型构建.....................................................................................................................................104.1数据特征..................................................................................................................................................104.2模型结构..................................................................................................................................................114.3模型标签..................................................................................................................................................124.4因子信号..................................................................................................................................................135多源蒸馏因子集成.....................................................................................................................................145.1树模型加权流程......................................................................................................................................145.2综合信号..................................................................................................................................................156指数增强组合.............................................................................................................................................176.1沪深300指数增强..................................................................................................................................176.2中证500指数增强..................................................................................................................................186.3中证1000指数增强................................................................................................................................197风险提示.....................................................................................................................................................20 图表目录 图1:知识蒸馏框架........................................................................................................................................4图2:示例模型多头超额收益累计................................................................................................................7图3:示例模型相关性分析............................................................................................................................7图4:ResNet降维数据..................................................................................................................................11图5:基本面信息融合.................................................................................................