国泰海通量化选股系列(三) 融合深度学习因子的500增强多策略组合实证 本报告导读: 传统多因子受限于因子表现的时序、截面波动,指数增强效果已经有显著退化。通过多策略方式,最大化因子选股效果,可以显著的提升最终指数增强效果。 余浩淼(分析师)021-23185650yuhaomiao@gtht.com登记编号S0880525040013 投资要点: 相对收益策略之风格及行业轮动策略2026.04.03国泰海通量化选股系列(二)——中证500指数增强策略的再探索2026.03.27ETF配置系列(一):恰逢其时2026.03.18ETF配置系列(六)——四象限月度行业轮动策略2026.03.16解码企业生命周期:股票投资的新范式探索2026.03.16 通过构建不同因子类型子策略,再在终端进行组合优化可以显著提升指数增强效果:500成分内,复合因子表现显著优于单纯的多粒度因子与小市值高增长因子,虽然相较于小市值高增长因子放大了回撤,但从收益与信息比角度有显著的增强。整体来看,多策略复合表现远优于传统多因子方法所构建的增强组合,年化收益提升10%左右,信息比也有明显提升。 多策略的增强组合构建方案仍有很多问题值得研究探讨:一方面在子策略的逐步复合过程中,单纯参照策略的历史表现并不一定最优权重配置方案,需要进一步研究更多的权重配置可行性。另一方面,受限于目前策略不够丰富,在最终的组合构建时难以进行精细化的风险因子暴露控制,由于最终放入优化器的只有两个资产,因此强行进行行业或其他风险因子暴露控制会导致优化器无法求得最优解。目前的多策略方法会有换手率失控的风险,从本文所述策略来看,最终换手率往往高达20倍左右,而同样因子的传统多因子组合换手率只有8倍左右。 风险提示。市场系统性风险、海外市场波动风险、模型误设风险。 目录 1.多因子模式的指数增强策略..........................................................................31.1.常规多因子方法的指数增强策略构建....................................................31.2.多因子模式的指数增强组合劣势汇总....................................................52.多策略方法的指数增强策略..........................................................................62.1.基础子策略的构建....................................................................................62.2.基础子策略的复合....................................................................................62.3.多策略组合构建与表现............................................................................83.总结................................................................................................................104.风险提示........................................................................................................11 1.多因子模式的指数增强策略 1.1.常规多因子方法的指数增强策略构建 对于量化指数增强模型,多因子方式往往是最常用的模型构建方法,该方式往往由以下三步: 挑选选股能力最优的多个因子。挑选适合的收益预测模型,利用最新期多因子获得股票预期收益向量。根据风控要求,利用优化器以预期收益向量为个股权重系数获得组合权重。 其中,决定组合收益高低的主要由前两步决定。随着量化选股的逐年发展,有效因子层面虽然依旧推陈出新,但找到在全域范围内均可以有效提升选股效果的因子难度已经愈发增大。很多时候,新老因子对于组合的表现提升,无论在时序上还是截面中,均有一定程度的波动特性,以IC为选股效果度量,全市场范围内在过去一段时间段有很好表现的因子,并不一定意味着其在特定选股域内也有显著的选股效果。 以小市值高增长组合所用到的多因子为例,该组合使用盈利加速,改进市净率,研发占比,ROE(波动率调整与一致预期调整),SUE(波动率调整与一致预期调整),市值,尾盘成交占比,大单净买入占比8个因子等权构建,其中,市值与尾盘成交占比因子值进行了取反处理。我们分别考察该8个因子在全市场与中证500指数中的表现,如下表: 上表中因子表现可以看出,部分因子在全市场与500成分内有明显的差异,其中市值因子在全市场表现明显小盘股效应,而500成分内IC均值接近0。绝大部分因子,无论全市场与500成分内表现差异是否很大,其全市场IC-IR均显著高于500成分内IC-IR。综上说明因子在截面与时序上均有显著的不稳定性,而缩小回归时的标的范围,虽然理论上可以体现因子截面表现的差异程度,但会大大增加回归参数的不稳定性,复合因子表现也会受到影响。 我们将小市值高增长因子以等权与域内加权两种形式分别构建复合因子,考察全市场复合因子与500成分内复合因子的月度表现,如下表: 考虑到市值因子对于复合因子影响的差异性,我们分别以包含市值的8因子以及不包含市值的7因子构建复合因子,同时分别采用回归法与等权法确定因子系数。 总体来看,等权法的复合因子显著优于回归法的复合因子,尤其从IC稳定性与多空、多头胜率的角度来看。这说明小市值高增长中部分因子由于受到自身稳定性较差的影响,回归法反而会给到更差的因子更高权重,从而导致复合因子表现更差。而从全市场与500比较的维度来看,在500成分内,去除市值因子后复合因子表现明显更优,而全市场角度来看,加入市值因子会在整体上给组合以更优的多头表现。这也充分体现了市值这一风格因子在截面上表现的巨大差异。 那么,对于多粒度因子,这种利用Level2行情,基于深度学习这一复杂非线性模型所构建的复合因子是否依然有截面表现与时序表现稳定性差异呢,我们考察多粒度因子周度表现,如下表: 多粒度因子的全市场表现与500成分表现差异度远大于小市值高增长因子,其500成分内多头表现月度化后,与无市值的小市值高增长组合接近,但周度胜率很低,因子500成分内表现大概率低于小市值高增长组合。 进一步的,我们用多粒度因子与小市值高增长的复合因子构建全市场空气值增组合,相对wind全A等权表现如下表: 净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 而如果我们用同样因子,构建500成分内组合,其超额收益情况如下表: 净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 整体来看,多粒度因子在全市场空气指增表现更稳突出,小市值高增长组合(剔除市值因子)在500成分内有更好的表现。但如果仔细观察净值曲线,不同时间区段多粒度因子与小市值高增长的表现也会有一定程度分化,走势优劣并非长期稳定持续。 1.2.多因子模式的指数增强组合劣势汇总 从上述分析可知,因子在时序与截面上表现往往会有显著分化,这会导致利用回归法进行多因子的因子收益回归时,无法基于因子的历史表现简单的给因子赋权。 单纯的域内回归会面临严重的回归系数波动问题,而全域回归的系数可能完全无法与域内的因子表现适配。简单的等权复合显然难称最优解,因子表现的优劣无法在因子权重中体现。从多粒度因子的表现来看,复杂的深度学习模型依然要面临线性模型相同的问题。 除此之外,多因子模型还有如下劣势: 不同周期间因子难以复合:多粒度因子的训练Lable窗口为一周与两周,因此因子往往用以构建日度或周度换仓组合。小市值高增长因子又是月度组合,不同周期频率的因子难以简单的混合叠加获得最优的因子权重。 特异性复合方式难以实施:无论用回归法还是简单等权,均是以因子多头信息为主,而从多粒度因子的表现情况来看,尤其在500成分内,其空头效应显著的优于多头效应。因此空头反向剔除反到可能是更优的组合构建方法,而这种方法难以利用回归或简单等权构建,深度学习等黑盒模型又无法控制合成方式。复合因子参数差异难以在回归中体现:复合因子的不同细微参数差异也会带来组合在时序上的表现提升,然而由于其高相关性,简单的将其放入回归或者等权模型,会导致在某些风格上的额外暴露,被动提升组合风险。 因此,我们尝试以多策略的形式,分层对不同因子,不同参数构建的多个子策略组合进行筛选、融合,并最终构建增强组合,从而争取达到相较于传统多因子组合更优的指数增强效果。 2.多策略方法的指数增强策略 2.1.基础子策略的构建 基础子策略以500成分内、全市场两个选股域,以及小市值高增长、多粒度因子两类复合因子,构建四个大类子策略,即: 500成分内多粒度策略。500成分内高增长策略(去除市值的小市值高增长复合因子)。全市场多粒度策略。全市场小市值高增长策略 上述同类参数策略,可以通过不同的参数叠加从而构建更加丰富的子策略,其选用的参数如下: 策略激进程度,即策略个股的最大权重。这里我们设定为1%,2%,与5%三挡。 反向剔除权重即多粒度因子,小市值高增长因子各自利用对方负向效应,现对于股票池进行删减,然后在进行多头选股。有1%,2%,5%,10%四组参数。小市值高增长对多粒度因子进行空头删减时,无论500成分内还是全市场,均采用不包含市值的高增长复合因子。用多粒度因子对小市值高增长因子进行空头删减时,以周频对股票池进行调整。 对于多粒度因子而言,考虑到日度换仓与周度换仓差异,会同时构建日度与周度换仓组合。 以上子策略组合中,小市值高增长为月度换仓组合,因此不进行任何换手约束。周度多粒度组合会进行30%换手率约束,日度多粒度组合换手约束则设定为6%。考虑到多粒度因子在全市场表现往往远优于小市值高增长因子,因此这里并不添加全市场的小市值高增长因子。 2.2.基础子策略的复合 对于最终以500增强为目标进行组合构建,我们需要将上述子策略复合为500成分内选股组合与全市场选股组合。考虑到同源子策略的高相关性,我们将复合过程分按如下步骤进行。 数据来源:Wind,国泰海通证券研究 首先,我们以过去一段时间,同选股域,同基础复合因子的基础子策略的收益率T值进行比较,筛选出表现最好的组合得到四个复合策略。 考虑到不同基础策略相关性更低,因此第二步的复合过程虽然会同样参考因子收率T值,但不再是单纯筛选,如果策略间表现差异不够大,则会按照一定比例进行复合,最终得到500成分内与全市场的筛选加权复合策略。 我们分别比较复合策略与上述复合因子构建的策略全市场表现,如下表: 净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 复合因子表现整体位于多粒度因子与小市值高增长因子之间的水平,但在25年以来,复合因子表现非常强势,明显强于多粒度因子与小市值高增长因子。 比较复合策略与上述复合因子构建的策略500成分内表现,如下表: 净值走势与分年度表现如下图: 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 500成分内,复合因子表现则显著优于单纯的多粒度因子与小市值高增长因子,虽然相较于小市值高增长因子放大了回撤,但从收益与信息比角度