
国泰海通量化选股系列(一) 基于PLS模型复合因子预期收益信号的应用研究 本报告导读: 本文主要考察根据因子历史长短期收益、波动率等数据,采用PLS模型预期因子收益在因子加权中的应用,包括单因子多策略、以及多因子单策略两个维度。 罗蕾(分析师)021-23185653luolei@gtht.com登记编号S0880525040014 投资要点: 如何克服因子表现的截面差异2025.12.282025年12月主要指数样本股调整预测2025.11.09核心指数定期调整预测及全市场流动性冲击测算2025.11.062026年度金融工程策略展望——高频资金流如何辅助宽基择时决策2025.10.29大类资产与中观配置研究(六)2025.10.26 风格组合配置维度,我们构建了6个基础组合:1个红利优选、1个成长期优选、两个小市值组合、以及两个风格相对均衡的组合--PB盈利和GARP组合。对波动较大组合采用PLS模型预期超额收益加权,相比于超额收益均值加权方式,年化收益提升3.3%;相较于等权方式,年化收益提升3.9%。 量化固收+策略中的应用,股票端:PLS预期收益加权复合风格组合;债券端:中证短债指数;构建10%股票仓位的固收+量化策略,2018年以来年化收益5.6%,年化波动率2.6%,信息比2.17;权益比例为20%时,策略年化收益8.4%,年化波动率5.1%,信息比1.65。 在多因子模型中,采用PLS预期收益确定因子权重,可改善多因子模型预期IC、以及top100组合业绩表现。但需要注意的是,这种改善效果并非在每一个截面都成立,相对而言,PLS或许更擅长风格之间的配置,而非同类之间的精细比较。时序角度,IC均值加权、ICIR加权、PLS加权方式各有优劣。整体而言,PLS加权方式更为稳健;但在因子动量持续性强时,表现不如IC均值加权、ICIR加权突出,例如2023年。 以PLS预期收益加权多因子模型top100组合作为股票端资产,中证短债指数作为债券端资产,构建20%股票仓位的股债复合量化固收+策略,2018.01-2025.11期间年化收益8.1%,年化波动率和最大回撤分别为5.6%、5.4%;在圈定的固收+基金中,收益排名除2020年处于32.1%分位点外,其余年份均在前1/2。 风险提示。本文根据客观数据和评价指标计算,不作为对未来走势的判断和投资建议。本文结论通过统计分析得出,存在历史统计规律失效风险、因子失效风险、模型误设风险。采用PLS模型确定因子权重,是模型基于历史数据自适应的过程,仅提供了一个可以尝试的选项,并不一定适用所有的因子组合。 目录 1.因子择时指标及PLS加权模型介绍..............................................................32.因子组合加权中的应用..................................................................................42.1.单因子多头组合加权................................................................................42.2.风格组合配置中的应用............................................................................62.3.小结............................................................................................................93.多因子模型加权中的应用..............................................................................93.1.PLS预期收益加权的多因子模型............................................................93.2.top100组合在固收+策略中的应用........................................................113.3.小结..........................................................................................................114.总结................................................................................................................125.风险提示........................................................................................................12 常见的因子择时指标有动量、波动率、拥挤度、市场涨跌等,但不同指标对因子的影响幅度不尽相同,且各择时指标之间也存在一定相关性,那么如何将这些具有一定相关性的择时指标复合起来呢? 与传统的最小二乘法相比,偏最小二乘法(PLS)可以在自变量存在相关性的条件下进行回归建模,同时允许样本点个数少于变量个数。通过潜变量的方式,PLS能够在解释因变量的同时,尽可能提取自变量中的有效信息。因此本文尝试采用偏最小二乘法对多个因子择时指标的复合进行研究,并将该方法在选择与配置量化组合问题中进行应用。 1.因子择时指标及PLS加权模型介绍 在多因子模型中,因子权重通常基于因子预期收益确定,常见的确定方式有,近12个月收益均值或信息比加权,这些加权方式类似于因子收益动量加权。若我们有多个参考指标,除因子历史收益外,还有不同回看窗口的波动率、拥挤状态等,那么这些因素该怎么融入模型中呢?本节我们尝试采用PLS方法构建因子收益预期模型,并以此为参考确定因子权重。 在构建PLS模型时,因变量Y为因子月收益率,自变量包括常见的因子择时指标:不同回看窗口的因子收益、波动率、拥挤度、市场涨跌状态等,具体为以下4类共7个指标: 动量:不同时间窗口的因子收益,包括过去3个月、12个月、5年、以及剔除过去1年的t-4至t-1年因子收益动量。波动率:最近一个月日收益波动率与长期波动率之比。拥挤度:最近一个月的因子收益是否达到过去1年月收益极大值。市场涨跌:过去1年市场(沪深300指数)月均收益是否大于0。 对于因子i,t月末,在预测其t+1月因子收益时,我们分如下两步骤进行: 根据历史数据,滚动计算因子收益对择时变量的响应系数beta。即以过去5年因子月收益率为因变量(60*1),上述7个择时指标为自变量(60*7),通过PLS回归计算响应系数beta。代入最新一期择时变量数据(1*7),计算t+1月因子预期收益。 我们以因子预期收益作为权重构建多因子模型,并将其与常见的等权、因子动量加权方式进行比较,以考察模型效果。具体因子包括市值、估值、低波、成长、盈利等20余个,如下表所示: 至于因子的组合形式,通常有单因子多策略、以及多因子单策略两种类型,接下来我们将分别对其进行考察。 2.因子组合加权中的应用 本节们构建单因子多头组合,然后考察不同加权体系下,因子组合复合策略的业绩表现。 月度调仓,选择因子得分最高的100只股票构建等权组合,扣除单边前2交易成本后,单因子多头组合相对于wind全A指数的业绩表现如表3所示。样本期间为2013.01-2025.11,但因子择时模型为滚动60个月数据建模,因此择时窗口期为2018.01-2025.11,下同。 需要注意的是,有些因子虽然多空收益显著,但多头端薄弱,例如反转、PB因子等。而在组合配置角度,我们通常不会选择一个没有显著超额收益的资产进行配置。因此在单因子多策略模块,我们只在历史上曾经有过显著超额的因子中进行选择。具体来看,月度滚动5年窗口,将从未出现过超额收益显著为正的因子剔除。回测下来,实际剔除的因子有反转、PB、改进动量、和现金利润占比4个因子。 2.1.单因子多头组合加权 滚动60个月构建因子择时模型,并根据模型预期收益加权各因子组合,得到的择时配置组合业绩表现如表4所示;为便于对比,我们也统计了收益均值加权(回看窗口为12个月)、信息比加权的结果。 结果显示,因子动量加权本身就是一个比较好的预测指标。超额收益均值加权单因子组合,2018年以来年化超额(相对wind全A指数)9.7%,相较于等权加权方式年化收益增厚2.7%,月胜率60%,统计显著。 采用PLS择时模型预期收益加权单因子组合,收益表现进一步改善。复合组合相对于wind全A指数的年化超额收益提升至10.8%;相较于等权加权方式,收益年化提升3.7%,月胜率70.5%,统计显著。 那是不是所有因子都需要择时呢?实际并非如此,波动比较小的因子或许并不需要复杂的模型,直接采用因子动量即历史收益均值加权即可。 具体从回测结果来看,若我们对波动最小的3个因子构建择时模型,其他因子采用收益均值加权,则复合组合2018年以来相对wind全A指数年化超额收益9.5%,信息比0.93,相比于全部因子都基于收益均值加权方式并无明显改善。 因此在确定因子权重时,我们或许可以只针对波动最大的N个因子采用PLS模型择时收益加权,其他因子采用简单收益加权即可。例如,N取3时,复合组合相对wind全A指数年化超额14.3%,相较于等权加权方式年化收益提升7.2%,月胜率71.6%。整体来看,对波动最大的3-5个因子择时,相较于因子动量加权方式,年化收益都能得到6-7%左右的提升。 若取N=5,即对波动(滚动12个月因子收益波动率)最大的5个因子采用PLS模型预期收益计算权重,各因子组合参与择时的月份数占比如图1所示。择时次数比较多的因子是市值、尾盘成交占比、换手率波动率和低换手率,择时月份数占比均超过50%;基本面因子波动大的时候较少,因此择时次数较少,如SUE、股息率等。业绩表现上,择时复合组合相对于wind全A指数年化超额13.7%,相较于等权加权方式收益年化提升6.6%,月胜率69.5%,年胜率100%(图2),统计显著。 资料来源:Wind,国泰海通证券研究 资料来源:Wind,国泰海通证券研究 为考察模型对数据的敏感性,我们将选股池修改为剔除市值最小10%个股后的剩余沪深A股,重新计算因子多头组合,并测算上述择时模型的效果,结果如表5所示。此时,等权加权略微优于IC均值加权;但因子择时模型仍保持相对优势。 2.2.风格组合配置中的应用 结合不同因子,可以形成风格特征不一的主动量化股票组合,那么这些组合是否也可以采用PLS模型预期的超额收益进行加权配置呢?本节尝试对该问题进行实证分析。 我们构建了6个基础风格组合:1个红利优选组合、1个成长期优选组合、两个小市值组合(一个偏高增长,一个偏价值)、以及两个风格相对均衡的组合——PB盈利和GARP组合,其构建方式具体如下表所示。 扣除单边千2交易成本后,基础风格组合的业绩表现如图3所示。整体来看,两个小市值组合收益弹性较大,但同时风险也相对更高,波动率、回撤水平较高;与之相反,红利组合则波动相对较低。PB盈利和GARP组合则较为均衡,特别是GARP组合,与红利、成长、小市值组合都具有一定正相关性。 若将6个基础风格组合等权复合,则2018年以来,复合策略年化收益24.7%(表7),相较于wind全A指数年化超额20.6%。对比单一策略,等权复合组合收益、波动都处于居中位置,收益比红利优选组合高,而波动、回撤小于小市值风格组合;相对市场超额收益更为稳健。