多因子风险模型简介:股票协方差矩阵估计是股票组合风险预测的核心,但简单的通过股票收益率样本协方差进行预测具有较大误差。 本文参考Barra中国股票风险模型CNE6(2018)的做法,在之前报告的基础上,利用多因子模型,将股票协方差矩阵拆解为因子协方差矩阵和股票特质风险矩阵分别进行估计,两者结合得到股票协方差矩阵估计。 因子协方差矩阵的估计:参考CNE6,因子协方差矩阵估计分四个步骤进行:1)通过因子收益率时间序列计算移动加权协方差矩阵;2)采用Newey-West方法对协方差矩阵进行调整,以解决单因子收益率的时间序列自相关性问题;3)使用特征值风险调整法(Eigenfactor Risk Adjustment)调整因子协方差矩阵的相关性;4)使用波动率预测偏误调整方法(Volatility Regime Adjustment),调整各因子的波动率以提高预测的稳健性。 股票特质性风险的估计:参考CNE6,股票特质风险的估计分三个步骤:1)通过残差收益率时间序列并构建结构化模型(Structural Model)估计股票特质波动率;2)采用贝叶斯方法对股票特质波动率进行收缩调整,提升估计的样本外效果;3)根据波动率预测偏误进行调整,提升估计稳定性。 多因子风险模型的应用举例:股票协方差矩阵估计主要应用在投资组合风险预测、风险归因和组合构建。1)以中证500指数为例,预测股票组合波动率。2)计算沪深300指数、中证500指数在各因子的风险贡献,进行事后风险归因。3)在指数成分股内构建最小方差策略、指数增强组合,介绍股票协方差矩阵在选股组合中的应用。 风险提示:量化模型基于历史数据构建,而历史规律存在失效风险。 国泰君安金融工程团队专注于量化选股、行业轮动、资产配置、量化择时等研究。在之前的因子研究系列报告中研究了超预期因子、分钟高频因子在不同股票池的选股效果,介绍了中证500、1000和2000指数增强策略的构建,复盘了A股风格轮动和因子表现。本文是基于Barra CNE6模型的A股风险模型实践的下篇,主要介绍和实现股票协方差矩阵的估计方法。 1.多因子风险模型简介 1.1.传统股票收益率样本协方差预测模型具有局限性 1952年,Markowitz提出了著名的“均值-方差模型”(Mean-Variance Optimization Model,MVO),创建了现代资产组合理论,将资产配置带入到量化配置时代。Markowitz提出采用收益率方差的方式刻画风险,为投资者从量化角度认知风险提供了渠道。但是,在实际投资过程中,对于资产收益率协方差矩阵的预测并非易事,在求解协方差矩阵时,投资者们往往将输入的收益率作为精确的量,但在样本数目有限的情形下(尤其是股票数目较大,需要估计的参数较多时),协方差矩阵较为病态,此时预测投资组合的波动率预测的样本外表现往往不够稳定。Shepard (2009)分析了最优投资组合(最优投资组合的定义如附录所示)的波动率的偏差幅度。在假设正态性和平稳性下,最优投资组合波动率的真实值𝜎和预测值𝜎存在如下的一个公式: 𝑇𝑟𝑢𝑒 𝑝𝑟𝑒𝑑 𝜎≈ 𝑝𝑟𝑒𝑑 𝜎 𝑇𝑟𝑢𝑒 𝑁1 − 𝑇 这里的N表示的是资产的数目,T表示的是观测值的数量。不难看出当观测值数目较少时,预测值会明显低估真实波动。 其次,由于真实收益率的时变性,投资者往往会采用近期的收益率序列估计股票方差矩阵,这进一步放大了收益率方差矩阵预测的误差。为了解决这种资产数目带来的投资组合波动率估计困难问题,学界和业界通过使用多因子模型,将股票风险归因到风险因子上,通过分别估计因子风险和股票特质风险,实现对股票的风险预测(股票协方差矩阵估计)。 在2024年5月19日发布的《基于Barra CNE6的A股风险模型实践:风险因子篇——权益配置因子研究系列06》中,参考Barra的CNE6模型,国泰君安金融工程团队已经完成了对A股风险因子体系的构建。本文将基于前期构建的风险因子提下,实现对股票协方差矩阵的估计。 1.2.多因子风险模型框架简介 Barra的多因子风险模型是目前业界最知名的多因子风险模型,广泛应用于投资组合分析领域。该模型由美国学者Barr Rosenberg在1985年创办的Barra公司推出,后2004年Barra公司被MSCI所收购,并继续进行迭代改进。第一代的Barra多因子模型USE1专注于美国权益市场,于1975年发布,后续陆续发布了改进的版本,经典版本为2011年发布的USE4模型。2005年,MSCI推出了专注于中国权益市场的CHE2模型,其后于2012年推出的改进版本CNE5模型受到国内机构投资者的广泛使用。2018年MSCI推出了针对中国市场最新的CNE6模型,对因子框架进行了进一步细分和扩充。 Barra多因子风险模型认为股票的收益受到一系列共同因子的驱动,股票的收益由共同因子的驱动收益和特质收益组成。因此,可以将股票组合的风险预测转化为因子风险预测和股票特质风险预测分别估计,从而达到降低维度、提高准确率的效果。具体来说,Barra CNE6多因子模型引入三大类因子来刻画股票收益,分别是市场(国家)因子、行业因子和风格因子,则任一只股票的收益都可以表示为如下因子暴露和因子收益: 𝑟=𝑓+∑𝑋𝑓+∑𝑋𝑓+𝜀 𝑛 𝑐 𝑛𝑖𝑖 𝑛𝑠𝑠 𝑛 𝑖 𝑠 共同因子的驱动收益 特质收益 其中,𝑟代表第n只股票收益率,𝑓代表国家因子的收益率。𝑋为个股n在行业𝑖上的暴露,个股在其所属行业上暴露为1,其余行业则全部为0。𝑋为个股在风格因子s上的暴露,在上式中的因子暴露一般取上一期的值。 𝑛 𝑐 𝑛𝑖 𝑛𝑠 根据公式(2),由于各股票的残差𝜀互不相关,可以得到股票组合的协方差矩阵与因子协方差矩阵的关系: 𝑛 𝑇 𝑉𝑎𝑟(𝑅)=𝑋𝑉𝑎𝑟(𝑓)𝑋+𝑉𝑎𝑟(𝜀) 𝑖 𝑛 记因子协方差矩阵为Σ,股票风险协方差矩阵为Σ,特质风险矩阵为Σ(对角线为特质波动率),那么可以将公式改写为如下的形式: 𝐹 𝑆 𝜀 𝑇 Σ=𝑋Σ𝑋+Σ 𝑆 𝐹 𝜀 公式(4)建立了连接因子协方差矩阵与股票风险方差矩阵的桥梁。对于持仓权重为𝑤的投资组合P而言,其风险(波动率)定义为: 𝑇 ()5 5 𝜎(𝑤)=√ 𝑤 Σ𝑤 𝑆 经由公式(5),结合𝑡期的因子暴露和对应的因子协方差矩阵以及特质风险矩阵,投资者可以将对投资组合的风险预测问题转化为对因子协方差矩阵及各个股票的特质性风险矩阵的估计问题: 𝑇 𝑇 √ 𝜎(𝑤) =𝑤(𝑋Σ𝑋+Σ)𝑤 𝐹 𝜀 因此,在多因子风险模型中,核心问题便是如何合理地估计因子协方差矩阵(Σ)与各个股票对应的特质波动率(Σ)。但是,直接通过样本协方差估计因子协方差矩阵与特质波动率,会有较大的估计偏误,因此Barra提出了一系列调整方法,来改进因子协方差矩阵与股票特质性风险矩阵的估计。本文的第二章与第三章将分别从这两个方面入手,阐释如何对因子协方差矩阵(Factor Covariance Matrix)与股票特质波动率矩阵(Specific Risk)进行调整。 𝐹 𝜀 图1:参考Barra CNE6模型,股票协方差矩阵估计流程图 2.因子协方差矩阵的估计 前文已经指出,在多因子风险框架下,资产的风险是由核心的多个因子驱动的。在2024年5月19日发布的《基于Barra CNE6的A股风险模型实践:风险因子篇——权益配置因子研究系列06》中,国泰君安金融工程团队构建了一套具有稳定解释力度的风险因子。下面本文将详细阐述如何从因子收益率的样本协方差矩阵出发,通过调整获得较为稳健的因子协方差矩阵(Factor Covariance Matrix)。大体上可以将其分为四个步骤: 1)通过因子收益率计算时序移动加权因子协方差矩阵。 2)采用Newey-West方法对协方差矩阵进行自相关调整。 3)采用特征值风险调整法(Eigenfactor Risk Adjustment)调整因子协方差矩阵相关性。 4)根据波动率预测偏误(Volatility Regime Adjustment)调整因子波动率。 经由以上步骤便可以实现对因子协方差矩阵Σ的有效估计。 𝐹 2.1.根据因子收益率时序计算因子加权协方差矩阵 因子协方差矩阵估计的第一步即为得到因子收益率协方差矩阵的原始估计。这里采用的方法是根据日度的因子收益率序列,采用移动加权样本协方差的计算方式对T期的因子收益率协方差矩阵𝐹进行估计。在估计时,本文采用了半衰期参数为𝜏=200的指数移动加权平均法对因子协方差矩阵进行了指数平滑,放大近期的日频因子收益率序列的影响。 (0)𝑇 𝐹𝜌 𝑇 𝑇−𝑠 ̅ ̅ ∑ 𝜆 (𝑓−𝑓)(𝑓−𝑓) (0)𝑘𝑙,𝑇 𝑠=𝑡−ℎ 𝑘,𝑠 𝑘 𝑙,𝑠 𝑙 𝐹 =𝑐𝑜𝑣(𝑓,𝑓)= ⁄∑ 𝑘 𝑡𝑇 𝑇 𝑡−𝑠 𝜆 𝑠=𝑇−ℎ (0)𝑘𝑙,𝑇 (0)𝑇 其中,𝐹表示因子收益率协方差矩阵𝐹的(𝑘,𝑙)位置对应元素。ℎ表示的是样本矩阵的尺寸,𝜆表示的是指数权重。本文设定𝜆=0.5,根据过去400个交易日的收益率数据滚动计算得到𝐹。 𝐹𝜌 1/𝜏 (0)𝑇 2.2.采用Newey-West方法对协方差矩阵进行调整 由于单因子收益率存在一定的时间序列上的自相关性,投资者还需要在因子收益率协方差矩阵的基础上做进一步的调整。本文采用Newey-West方法,对前文求解出的因子协方差矩阵𝐹进行进一步的调整。 (0)𝑇 Newey-West方法被广泛用于普通最小二乘方法,可以有效地降低自相关性和异方差性的影响。本文的多因子风险模型根据Newey-West方法构建调整矩阵𝐹,其在T时的计算方式如下公式所示: (𝑁𝑊) 𝑙𝑎𝑔 Δ (𝑁𝑊)𝑇 (𝑁𝑊)𝑇,+Δ (𝑁𝑊)𝑇,−Δ 𝐹 =∑(1− )∗(𝐶𝑙𝑎𝑔+1 +𝐶 ) Δ=1 这里的𝐶 与𝐶 实际上是两个调整因子,其(𝑘,𝑙)位置元素分别为 T,+Δ T,−Δ (𝑁𝑊)𝑘𝑙,𝑇+Δ (𝑁𝑊)𝑘𝑙,𝑇−Δ 𝐶 与𝐶 ,计算公式为: (𝑁𝑊)𝑘𝑙,𝑇+Δ 𝐶 =𝑐𝑜𝑣(𝑓 ,𝑓) 𝑘,𝑇−Δ𝑙,𝑇 (𝑁𝑊)𝑘𝑙,𝑇−Δ 𝐶 =𝑐𝑜𝑣(𝑓,𝑓 ) 𝑘,𝑇 𝑙,𝑇−Δ (𝑁𝑊)𝑇 将调整后的𝐹 与待调整的矩阵相加即可得到经由Newey-West方法调 整后的因子收益率协方差矩阵。 为了保证调整后的矩阵具有正定性,本文根据不同的𝑙𝑎𝑔进行两次Newey-West方法调整,具体操作过程如下: (𝑁𝑊)𝑇,𝜌 1)根据𝑙𝑎𝑔=2计算出经由Newey-West方法调整后的矩阵中拆解出对应的相关系数矩阵。 𝐹 ,从 𝜌 (𝑁𝑊𝑐𝑜𝑟𝑟)𝑇,𝜌 𝐶𝑜𝑟𝑟 (𝑁𝑊)𝑇,𝜎 2)根据𝑙𝑎𝑔=1计算出经由Newey-West方法调整后的矩阵解出对应的矩阵标准差。 𝐹 ,拆 𝜎 (𝑁𝑊𝑠𝑡𝑑)𝑇,𝜎(𝑁𝑊𝑐𝑜𝑟𝑟)𝑇,𝜌 𝜎 (𝑁𝑊𝑠𝑡𝑑)𝑇,𝜎 3)结合 𝜎 与 𝐶𝑜𝑟𝑟 ,得到经由两次Newey-West方法调整后 (1)𝑇 的因子收益率协方差矩阵𝐹。 𝑇 (1)𝑇