您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华安证券]:“学海拾珠”系列之二百三十八:高维环境下的最优因子择时 - 发现报告

“学海拾珠”系列之二百三十八:高维环境下的最优因子择时

2025-06-12吴正宇、严佳炜华安证券付***
AI智能总结
查看更多
“学海拾珠”系列之二百三十八:高维环境下的最优因子择时

高维环境下的最优因子择时 ——“学海拾珠”系列之二百三十八 金融工程 专题报告 报告日期:2025-06-12 主要观点: 分析师:吴正宇 执业证书号:S0010522090001邮箱:wuzy@hazq.com 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 相关报告 1.《马科维茨模型中均值的最优收缩— —“学海拾珠”系列之二百三十七》 2.《基于层级动量的投资组合构建——“学海拾珠”系列之二百三十六》 3.《新闻公告与短久期溢价——“学海拾珠”系列之二百三十�》 4.《利用强化学习和文本网络改进相关矩阵估计——“学海拾珠”系列之二百三十四》 5.《风险收益的权衡:宽松型风险平价模型——“学海拾珠”系列之二百三十三》 6.《资产与因子风险预算:一种均衡策略——“学海拾珠”系列之二百三十二》 本篇是学海拾珠系列第二百三十八篇。本文研究了最优因子择时策略的构建方法。作者发现,通过整合众多因子与预测变量来构建择时策略,可以显著提升收益。该策略的关键在于运用收缩技术,其在估计最 优投资组合权重时,保留了一份对因子择时潜在收益的审慎怀疑态度。这种收缩机制能够有效防止最优择时投资组合在构建过程中被历史数据中看似诱人、实则虚假的因子择时机会误导。因此,即使面对海量的因子-预测变量组合,该方法依然能表现优异。 最优因子择时投资组合的估计方法 首先,使用Ledoit和Wolf(2003)的协方差矩阵估计量,并按照Schäfer和Strimmer(2005)的方法计算最优收缩强度。其次,使用Kozak、Nagel和Santosh(2020)收缩方法的一个变体来估计组合权重。该方法隐性地表 达了对存在极高夏普比投资机会的怀疑。第三,对组合权重进行重新缩放, 使得最优择时策略对原始因子的绝对权重之和在每期恰好等于1。 最优因子择时策略表现出色 本文提供了实证证据表明,在各种规模的模型中,从包含少量因子和预测变量的模型到高维模型,作者持续观察到了中等程度的因子择时收益,即使在扣除合理的交易成本之后,这种收益依然存在。 核心内容摘选自CfaRL,MehtaM,NagelS.于2025年3月在 《Taylor&Francis》上发表的论文《OptimalFactorTiminginaHigh-DimensionalSetting》。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 正文目录 1引言4 2因子择时投资组合5 3因子择时最优投资组合的估计6 4实证流程7 5因子与预测变量8 6实证结果10 7结论17 风险提示:18 图表目录 图表1文章框架4 图表2训练期、验证期和样本外8 图表3小因子集和预测变量9 图表4样本外组合收益10 图表5收缩超参估计11 图表6FAMA-FRENCH因子组合的样本外夏普比12 图表7最优FAMA-FRENCH因子择时组合的平均权重13 图表8FAMA-FRENCH最优因子择时组合的原始因子权重14 图表9FAMA-FRENCH大盘股版本最优组合样本外夏普比14 图表10JENSEN因子集组合样本外夏普比15 图表11JENSEN因子集最优因子择时组合的平均权重16 图表12交易成本的调整17 1引言 图表1文章框架 资料来源:华安证券研究所整理 机器学习方法使得在收益预测和投资组合构建中整合大量信号变得可行。迄今为止,该领域的大部分研究都集中在横截面上,即使用公司层面的股票特征来预测股票间预期收益的差异。由此产生的投资组合代表了大量股票收益因子的静态组合。相比之下,对时间序列维度的关注则少得多。机器学习方法能否帮助结合来自大量时间序列预测变量和大量因子的信息,在高维环境下构建最优的因子择时策略? 从概念上讲,如果因子收益在某种程度上不可预测,那将是令人惊讶的。那些导致横截面收益可预测性的经济力量,其强度也可能随时间而变化。例如,假设价值价差具有行为学根源,即许多投资者对价值股前景过于悲观,而对成长股过于乐观。几乎没有理由认为这种回避价值股的行为倾向(以及由此产生的价值溢价)会随时间保持恒定。同样,如果一个因子因其定价的宏观经济风险敞口而获得预期超额收益,这种补偿也不太可能是恒定的。当然,因子择时在概念上成立并不意味着在实践中是可行的。 现有的因子择时研究大多集中在单一预测变量或非常少的预测变量和投资组合上,且效果不一。本文证明了当在投资组合优化框架中联合使用大量因子收益预测变量时,可以实现因子择时收益。在实证分析中,作者使用Fama和French(2015)的四因子以及Jensen、Kelly和Pedersen(2023)的更大因子集作为择时对象。本文使用宏观经济变量作为预测变量,以及因子特定的预测变量,如价值价差、动量以及 其他因子多空两端的特征价差。 本文在方法论上利用了这样的洞见:因子收益与滞后预测变量的叉积代表了因子择时投资组合,其中滞后预测变量驱动着因子权重的时变。遵循Brandt和Santa-Clara(2006)的思路,这将因子收益的时间序列预测问题转化为寻找这些因子择时投资组合的均值-方差最优组合的横截面问题。当预测变量或因子投资组合数量很大时,因子择时投资组合的数量会变得非常庞大。因此,必须通过多层收缩正则化来约束最优组合权重的估计,这至关重要。首先,采用Ledoit和Wolf(2003)的协方差矩阵收缩估计量。其次,估计的组合权重通过一种改编自Kozak、Nagel和Santosh(2020)的方法进行收缩。该方法与机器学习应用中常见的岭回归方法有相似之处。第三,我们专注于因子轮动策略,该策略在每一期对基础股票因子总是保持相同规模的多空头寸,只有相对分配随时间变化。这防止了策略采取具有极高隐含杠杆的极端头寸。 本文建立在前期研究的基础上。Asness、Chandra、Ilmanen和Israel(2017)研究了利用每个因子的价值价差进行因子择时。他们发现择时收益甚微。与他们的结果类似,当限制预测变量仅为价值价差时,发现择时收益也非常小。然而,当将预测变量集扩展到多个因子特定预测变量和宏观经济变量并联合使用时,作者发现择时收益要大得多。Haddad、Kozak和Santosh(2020)表明,当专注于对股票因子的主成分而非单个因子本身进行择时时,基于价值价差的择时收益更大。其他论文则关注使用因子自身过去收益作为择时信号的因子动量策略。Gupta和Kelly(2019)发现股票因子存在时间序列因子动量,而Avramov等人(2017)以及Arnott、Kalesnik和Linnainmaa(2023)则发现了横截面因子动量的证据。DeMiguel、Martin-Utrera和Uppal(2024)专注于因子的波动率择时。与这些论文不同,Kagkadis等人(2024)像我们一样组合了许多预测变量,但与本文不同,他们并非旨在构建最优加权的因子择时策略。相反,他们考虑了基于因子收益预测的多种启发式因子组合方式。类似地,Neuhierl等人(2023)将大量因子与大量预测变量结合使用,通过每期按预测收益对因子进行排序来形成简单的投资组合。相比之下,将时变最优因子组合的选择嵌入到一个投资组合优化框架中。Dichtl等人(2019)也考虑了众多预测变量,但他们通过一种临时性限制对维度进行缩减,仅使用两类预测变量的第一主成分。相反,本文的方法通过数据驱动的最优收缩来适应高维度。最后,Kelly等人(2024)也使用了将收益与滞后预测变量交互的择时投资组合方法,但他们使用了预测变量的非线性变换,并且专注于对市场因子择时,而非横截面资产定价因子。 2因子择时投资组合 本文首先描述因子择时投资组合的构建。令Ft表示在t月的零投资股票多空因子收益,令Xt−1表示在t-1月末测量的预测变量。假设Xt−1已被标准化为具有单位标准差和零均值的z值。将因子择时投资构建为因子与滞后预测变量的叉积: 滞后预测变量Xt−1现在充当了一个对因子F进行择时策略的投资组合权重:当Xt−1为正时,策略在因子F上持有多头头寸;当Xt−1为负时,则持有空头头寸,有效地反转了多空因子的方向性敞口。 因子择时投资组合的期望收益取决于Xt−1是否能预测因子收益。利用E[Xt−1]=0 的事实,可以得到: 因此,如果Xt−1不能预测Ft,协方差为零,那么因子择时投资组合的期望收益也为零。如果Xt−1与Ft正相关,则期望收益为正。此外,择时收益不仅可来源于预测收益,还可来源于预测风险。可以证明,如果Xt−12与Ft的条件方差负相关,那么这将降低因子择时投资组合的无条件方差。直观地说,如果因子择时投资组合在Ft的条件波动率较低时承担较高的(正或负)绝对敞口,而在其他时候承担较小的敞口,这将降低该投资组合的无条件风险暴露。 作者为每个可能的预测变量-因子组合构建如公式(1)所示的因子择时投资组合。若有K个因子和J个预测变量,则会产生KJ个因子择时投资组合。作者总是将原始因子包含在因子择时投资组合中,这意味着前J个预测变量中的前K个总是设置为常数1。 这些因子择时投资组合的创建,将每期对K个因子进行最优择时的时间序列问题,转化为了为KJ个因子择时投资组合选择最优恒定权重的横截面问题。从概念上讲,这现在是一个基于因子择时投资组合收益的无条件均值和协方差的标准均值-方差优化问题。例如,如果一个预测变量Xt−1与Ft强正相关,那么涉及该预测变量和因子组合的因子择时投资组合具有高期望收益,这在所有因子择时投资组合的均值-方差最优组合中可能值得赋予较高权重。通过始终给予因子择时投资组合Xt−1Ft较高的权重,最优策略就在X滞后期较高时增加对因子F的敞口。 3因子择时最优投资组合的估计 在t月末选择KJ个因子择时投资组合的均值-方差最优组合的一个简单方法是,在均值-方差最优组合权重公式中,将KJ×1维的期望超额收益向量μ和KJ×KJ维的协方差矩阵Σ,替换为截至t月数据估计的因子择时投资组合的样本均值μt和样本协方差矩阵Σt, 然而,由于因子择时投资组合的数量很容易变得庞大,且对这些投资组合的期望收益和协方差的估计会受到显著的估计误差影响,这种将均值和协方差的历史估计值直接代入均值-方差最优组合权重公式的朴素方法不会产生良好的样本外表现。需要一种不同的方法来约束最优组合权重的估计。在本文的方法中,采用了三种类型的收缩,以减少估计的组合权重对估计误差的敏感性。第一种和第三种是标准的,而第二种在此因子择时应用中是新颖的。 首先,使用Ledoit和Wolf(2003)的协方差矩阵估计量,确保即使有数千个因子择时投资组合,协方差矩阵也能表现良好。具体而言,采用其估计量版本,将协方差矩阵收缩至单位矩阵乘以KJ个因子择时投资组合的平均方差。按照Schäfer和Strimmer(2005)的方法计算最优收缩强度。令Σt表示基于截至t的数据得出的此收缩协方差估计量。 其次,使用Kozak、Nagel和Santosh(2020)收缩方法的一个变体来估计组合权重。该方法隐性地表达了对存在极高夏普比投资机会的怀疑。之所以施加这种怀疑 有利于样本外表现,是因为当此类机会在历史数据中看似明显时,这往往只是由于过去收益均值和协方差的估计误差造成的巧合。因此,该方法使组合权重偏离尝试 利用这些看似“好得难以置信”的机会。正如Kozak、Nagel和Santosh(2020)所解释的,该方法与岭回归有相似之处,但其惩罚函数与标准岭回归有所不同。在对该方法的调整中,最优组合权重采用以下形式: 其中向量μt的前K个元素包含原始因子的平均收益,剩下的K(J-1)个元素包含因子-预测变量组合的平均收益。在此表达式中,Dt是一个对角矩阵,其对角线元素等于Et较低K(J-1)维的对角线元素。超参数λ控制组合权重的收缩程度。它除以Tt (可用于估计St和At的训练数据集的大小),因为当训练数据集较小、估计值易受估计误差强烈污染时,通常需要更多的收缩