AI智能总结
如何克服因子表现的截面差异 分域训练在深度学习情景下的尝试 本报告导读: 在深度学习场景下进行分域训练尝试,在一定程度上可以增强因子表现更好的中小市值股票选股能力,对于大市值股票选股能力甚至有一定程度削弱。 余浩淼(分析师)021-23185650yuhaomiao@gtht.com登记编号S0880525040013 投资要点: 2025年12月主要指数样本股调整预测2025.11.09核心指数定期调整预测及全市场流动性冲击测算2025.11.062026年度金融工程策略展望——高频资金流如何辅助宽基择时决策2025.10.29大类资产与中观配置研究(六)2025.10.26中证港股通科技指数投资价值分析2025.10.24 按照市值重新加权因子,对于中证500与中证1000增强组合有明显选股效果提升,沪深300效果提升不显著:对于沪深300而言,分域加权的方式几乎无法对基础组合产生增强效果,以base_w=0进行极端赋权,其收益状况可能更加恶化。在500宽约束组合中,分域训练可以有一定的提升效果,但整体而言效果并不显著。严约束组合则无法通过分域训练得到最显著的模型提升。市值分域加权对于1000增强组合的提升较为显著,无论宽严组合,年化收益提升均能超过1%。整体来看,与基于线性回归的因子动量组合不同,虽然均以量价因子为主,且因子构建逻辑基本相近,但按市值分域对于深度学习因子增强主要体现在中小市值股票,而线性回归模型则主要体现在大市值股票中。 深度学习因子需要面对数据本身选股能力高低以及能否获得理论最优参数的双重限制:深度学习模型参数的设定需要通过梯度下降的方法在参数空间中寻找最优解。而由于防止陷入局部最优,计算资源有限等限制,这种寻找过程往往受到随机的初始点的影响,并会依据模型在验证集上是否有提升设计早停机制。这样的最优解方式使得每次得到的最优解存在大幅波动,并且很难得到理论上真正的全局最优解。对于深度学习模型而言,输入信息包含有效信息过少,信噪比过低,除了会导致模型本身的理论预测能力不足外,我们通过梯度下降得到的参数甚至距离理论最优参数都有很大的距离,极端情况下我们得到的参数本可能就是噪音。风险提示。市场系统性风险、海外市场波动风险、模型误设风险。 目录 1.深度学习模型构建与特性分析......................................................................31.1.深度学习模型构建....................................................................................31.2.不同Loss函数下模型表现.......................................................................32.基于市值分组的分域加权深度学习因子构建尝试.......................................82.1.基于Loss函数的市值分组分域加权.......................................................82.2.基于市值分组的分域加权深度学习因子表现........................................92.3.基于市值分组的分域加权深度学习组合表现......................................123.总结................................................................................................................184.风险提示........................................................................................................18 1.深度学习模型构建与特性分析 1.1.深度学习模型构建 本文深度学习模型主要基于高频量价数据,低频量价数据以及基本面数据构成,其中高频量价指标包含以下部分: 开盘半小时、收盘半小时、以及盘中的买入意愿占比,买入意愿强度,以0倍、1倍、2倍、3倍标准差为阈值的大单净买入,卖单大单买单非大单,买卖均为大单的占比。 低频量价数据包含以下部分: 市值,市值三次方,估值,换手率,自由流通换手率,非流动性,动量,反转,特质波动率。 基本面数据包含以下部分: SUE,ROE,分红以及各自对应标记是否有指标的虚拟变量。所使用的模型架构如下图所示: 数据来源:Wind,国泰海通证券研究 高频量价与日度量价分别取过去63个交易日作为时序数据输入RNN+FNN构建网络,基本面因子取最新数据加入FNN网络,最后三个输出共同输入Linear层复合成为最终因子。 我们将训练集设置为104周(2年),验证集设置为26周(半年),每26周训练一次,标签为未来2周收益率,并分别尝试标准化后的原始收益率以及标准化后的Rank收益率两种方法。 1.2.不同Loss函数下模型表现 Loss函数对于深度学习模型选股因子表现会产生显著影响,如果从理论上来看,Rank MAE作为Loss函数,虽然会牺牲整体因子表现,但会最大程度提升因子的单调性。与之相比较,以IC为Loss函数,则会最大程度提升因子的多空收益,但分组单调性不会得到保证。 因此,我们统计不同的Loss函数下,单因子在全市场,沪深300成分,中证500成分,中证1000成分,以及小市值(不在沪深300,中证500,中证1000成分以外股票,下同)股票中表现如下表: 从不同Loss函数表现来看,MAE表现显著弱于MSE或者IC,尽管从理论上来看,以收益率取Rank的MAE作为Loss函数可以最大程度照顾不同历史收益分布的股票表现,但从单因子表现来看,无论在全市场还是在不同的指数成分中,多空收益与多头收益均显著弱于其他Loss函数。不过若以Rank MAE作为评价指标,该Loss函数则略优于其他Loss函数。 MSE与IC因子表现差异较小,但如果对收益率取Rank,则会牺牲一定程度的多空与多头表现,但从Rank MAE作为评价指标来看,其整体预测效果相较于不取Rank有所提升。 各个Loss函数对应全市场分组收益,如下图所示 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 从分组单调性来看,收益取Rank之后,中间组收益有明显提升,不取Rank则极端组收益更高。 考察上述不同Loss函数下深度学习因子在指数增强中的表现,其中,组合约束条件如下表: 沪深300增强组合,宽约束下取Rank的MSE与IC作为Loss函数表现最优,严约束下差距不显著。 不同Loss函数深度学习因子在沪深300中表现如下表: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 对于沪深300增强而言,以MAE为Loss函数表现非常差,几乎没有超额收益。历史整体看,MSE与IC表现接近,收益率取Rank在宽约束下表现更优,严约束下差异并不明显。但如果分年度来看,四种较为有效的Loss函数在不同年度表现有明显分化,没有稳定的强弱规律。 中证500增强组合,宽约束下IC作为Loss函数最优,严约束下MSE作为Loss函数最优,收益率取Rank均有显著收益损失。 不同Loss函数深度学习因子在中证500中表现如下表: 500宽约束组合超额净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 对于中证500增强,收益率取Rank无论宽约束严约束均会显著损失组合表现。在宽约束下,IC为Loss函数效果最好,在严约束下,MSE为Loss函数效果最佳。不同Loss函数间差异较为显著,但分年度不同Loss函数表现也并非绝对稳定。 中证1000增强组合,IC为Loss函数表现均最优 不同市值加权复合因子在中证1000中表现如下表: 1000宽约束组合超额净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究对于1000增强组合而言,IC为Loss函数有更优的组合表现。 整体而言,偏中小盘的500、1000增强组合,以不取Rank的IC、MSE为Loss函数会有更好的收益表现,尤其对于1000增强组合而言,最为极端的IC作Loss函数表现最优。添加Rank虽然无法显著提升组合收益,但对于控制组合回撤往往有比较好的作用,无论在300,500或者1000增强中,添加了Rank的Loss函数回撤均显著小于不添加Rank的Loss函数。 2.基于市值分组的分域加权深度学习因子构建尝试 2.1.基于Loss函数的市值分组分域加权 当我们需要进行指数增强组合构建时,需要模型不仅仅关注全市场的股票收益预测效果,更加需要注重贴合选股目标的股票域内收益预测表现。 考虑到最常见的指数增强组合往往基于沪深300,中证500,中证1000这样的市值加权指数,因此我们将全市场股票按市值大小聚类分为11组,构建11个不同的深度学习模型。 每个模型均保持相同的输入特征、模型结构,但在Loss函数层面,会由等权的Loss函数改为基于11个不同权重向量的加权Loss函数。其中,每个权重向量的权数计算入以下公式:(𝟏−𝒘𝒃𝒂𝒔𝒆) 其中n为分组数,设定为11,I为最大权重分组,尝试I=1到I=n所有分组情况。𝑤𝑖为最大权重组为I时,位于第i组的股票权数,𝑤𝑏𝑎𝑠𝑒为最小 权数,分别设定为0.9、0.5、0三种情况。最终构建的权数列表如下图: 2.2.基于市值分组的分域加权深度学习因子表现 我们按照上述市值分组加权方法,分别构建IC,Rank IC,MSE,RankMSE四种不同Loss函数下,不同分组因子在全市场IC表现,如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究整体来看,极端的权重分配对于因子全市场选股效果破坏性尤其明显, 无论是多头加权还是空头加权,无论哪种Loss函数极端加权后因子全市场选股效果都收到了极大破坏。 不同分组因子在沪深300成分IC表现,如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究图25:Rank MSE深度因子沪深300成分IC(2017.01- 在沪深300域内,极端多头加权的IC与MSE深度因子会有一定幅度的多空选股效果提升,而对于Rank IC与Rank MSE深度因子而言,多头组也不会有很大的300域内改善。 不同分组因子在中证500成分IC表现,如下图: 资料来源:Wind,国泰海通证券研究图28:MSE深 度 因 子中 证500成 分IC(2017.01- 资料来源:Wind,国泰海通证券研究图29:Rank MSE深度因子中证500成分IC(2017.01- 分域后不同Loss函数深度因子在500域内相对等权有更多分域模型IC更高,除Rank MSE深度因子不太稳定以外,其他分域因子在第8组左右大比例高于等权因子。 不同分组因子在中证1000成分IC表现,如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind