AI智能总结
深度学习赋能因子挖掘2.0:综合应用方案 金融工程研究团队 ——市场微观结构系列(32) 魏建榕(首席分析师)证书编号:S0790519120001 魏建榕(分析师)weijianrong@kysec.cn证书编号:S0790519120001 盛少成(分析师)shengshaocheng@kysec.cn证书编号:S0790523060003 开源金工因子挖掘2.0模型框架概览 傅开波(分析师)证书编号:S0790520090003 在《深度学习赋能交易行为因子》,我们初步提出了1.0因子挖掘框架:1、日度变化类指标通过LSTM,提取隐藏层;2、财务指标截面标准化后拼接在其后,再通过MLP输出为最终的因子。本篇报告将对1.0版本的因子挖掘框架进行升级,主要为三点:1、变量的丰富;2、网络的迭代;3、应用的升级。 高鹏(分析师)证书编号:S0790520090002 基础行情测试模型有效性 1、对于网络而言,本文选择GRU和GAT。对于GAT的关联网络我们尝试了:行业、财务、资金流三大维度,其中基于财务网络挖掘出的因子多头表现相对最好。 2、对于三种不同的GAT网络而言,未来10日RankIC与过去20日Barra因子收益存在一定相关性。相较于三个因子简单等权,本文采取SA加权:在训练时加入一层可学习的mlp层,输入端为Barra风格因子收益。3、进一步地,我们参考《深度学习赋能交易行为因子》,考虑财务后,因子绩效进一步提升,尤其多头端提升较为明显。其10日RankIC为11.7%;多头超额收益为24.1%,信息比例为3.0;多空收益为58.9%,信息比例为5.1。 苏俊豪(分析师)证书编号:S0790522020001 胡亮勇(分析师)证书编号:S0790522030001 王志豪(分析师)证书编号:S0790522070003 多特征集训练 1、G。该维度来自《深度学习赋能技术分析》,是基于基础行情的衍生指标,包含:技术指标和K线状态变量。因子10日RankIC为11.0%。 2、C。该维度是大小单资金流相关特征,包含:1、原始数据;2、衍生指标;3、状态变量。因子10日RankIC为10.6%。3、HF。该维度是高频数据降维的日度特征。因子10日RankIC为11.6%。4、DP。该维度是遗传算法有效因子。因子10日RankIC为11.4%。5、合成。ML_C因子10日RankIC为14.2%;多头超额收益为26.1%,信息比例为3.1;多空收益为72.7%,信息比例为6.1。 盛少成(分析师)证书编号:S0790523060003 蒋韬(分析师)证书编号:S0790123070037 深度学习应用 1、多头优选个股。在《深度学习赋能风格轮动和多策略融合》中,我们提出了基于强化学习的风格轮动方案。本篇报告中,我们将选股和风格轮动融合在一起,构建Beta+Alpha的深度学习优选组合。从2020年至今,全A优选50年化收益38.52%,在中证800+中证1000成分股内,优选30年化收益26.18%。 相关研究报告 《遗传算法赋能交易行为因子—市场微观结构(20)》-2023.8.6《深度学习赋能交易行为因子—市场微观结构(24)》-2024.5.24《深度学习赋能风格轮动与多策 略 融 合—开 源 量 化 评 论(103)》-2024.12.12 2、行业轮动因子构建。采取自下而上的聚合,构建行业轮动因子,10日RankIC为9.27%。其还可用在上证50增强中,超额年化收益为4.95%,信息比率为2.28。3、指数增强。使用ML_C进行指增,从2020年至今,不同宽基绩效如下:沪深300增强超额年化收益为6.77%,信息比率为2.06;中证500增强超额年化收益为10.72%,信息比率为2.83;中证1000增强超额年化收益为14.41%,信息比率为3.26。 《深度学习赋能技术分析—开源量化评论(109)》-2025.6.25 风险提示:本报告模型基于历史数据测算,市场未来可能发生重大改变。 目录 3.1.1、状态变量转化示意............................................................................................................................................113.1.2、基于特征集G挖掘的因子绩效展示................................................................................................................113.1.3、PV和G的联合.................................................................................................................................................12 3.2.1、人工挖掘因子回顾............................................................................................................................................123.2.2、大小单资金流特征增强....................................................................................................................................123.2.3、基于特征集C挖掘的绩效展示........................................................................................................................133.2.4、人工挖掘资金流因子和深度学习资金流因子对比.........................................................................................13 3.4、DP:遗传算法因子......................................................................................................................................................143.4.1、遗传算法因子挖掘流程回顾.............................................................................................................................143.4.2、深度学习再掘金................................................................................................................................................15 4.1、不同特征集汇总...........................................................................................................................................................154.2、不同维度交叉挖掘.......................................................................................................................................................164.3、不同样本空间测试.......................................................................................................................................................16 5.1.1、强化学习风格优选示意....................................................................................................................................175.1.2、全A优选...........................................................................................................................................................175.1.3、中证800+中证1000内优选.............................................................................................................................18 5.3.1、上证50增强......................................................................................................................................................205.3.2、沪深300增强、中证500增强、中证1000增强...........................................................................................21 7、风险提示..................................................................................................................................................................................23 图表目录 图1:开源金工因子挖掘2.0流程概览........................................................................................................................................5图2:基于资金流关联网络,收益率牵引因子具备一定选股效果............................................................................................7图3:“GRU+GAT_财务”与“GRU+GAT_行业”计算得到因子的未来10日RankIC差值与过去20日Barra因子相关