您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:精品文献解读系列(二十六):如何衡量观测因子拥挤度 - 发现报告

精品文献解读系列(二十六):如何衡量观测因子拥挤度

2022-02-22赵索国泰君安证券偏***
精品文献解读系列(二十六):如何衡量观测因子拥挤度

投资学是一门学术界与业界紧密结合的学科,其中大类资产配置是这种紧密结合的代表。从Markowitz(1952)开创现代投资组合理论开始,学术界为业界提供了丰富的理论参考和方法模型,推动了大类资产配置实践的繁荣发展。为了帮助读者及时跟踪学术前沿,我们推出了“精品文献解读”系列报告,从大量学术文献中挑选出精品论文进行剖析解读,为读者呈现大类资产配置领域最新的思路和方法。 本篇为读者解读的文献是Bonneet al(2018)发表的工作论文“MSCI integrated factor crowding model”。 因子观念的广泛传播既导致了因子投资的流行,也产生了因子拥挤。 偶发但显著的因子回撤,使得市场对因子拥挤预警模型的需求渐成刚需。为此MSCI引入了所谓MSCI的综合因子拥挤模型,通过一个标准化的因子拥挤程度指标,为投资者提供择时决策依据。该指标涉及 (1)持仓、(2)定价-收益、(3)估值价差、(4)做空率差、(5)两两相关、(6)相对波动率和(7)因子动量。研究表明,上述信息对在因子波动和收益上都有解释效力,而且本文发现出现了拥挤信号的因子在后续的12个月中比没有拥挤信号的因子将有更大的频率(相差7倍)出现显著的因子回撤。 因子模型显然不是免费的午餐,产生超额收益同时往往也产生了超额的风险,而这正是所谓因子拥挤。本文综合多方面的信息,提供了一种评价因子拥挤程度的方法,值得战略和战术资产配置投资者借鉴。 1.文献概述 文献来源: Bonne G,Roisenberg L,Kouzmenko R,et al.MSCI integrated factor crowding model. 2018. 文献摘要: 因子观念的广泛传播既导致了因子投资的流行,也产生了因子拥挤。偶发但显著的因子回撤,使得市场对因子拥挤预警模型的需求渐成刚需。 为此MSCI引入了所谓MSCI的综合因子拥挤模型,通过一个标准化的因子拥挤程度指标,为投资者提供择时决策依据。该指标涉及(1)持仓、 (2)定价-收益、(3)估值价差、(4)做空率差、(5)两两相关、(6)相对波动率和(7)因子动量。研究表明,上述信息对在因子波动和收益上都有解释效力,而且本文发现出现了拥挤信号的因子在后续的12个月中比没有拥挤信号的因子将有更大的频率(相差7倍)出现显著的因子回撤。 文献评述: 因子模型显然不是免费的午餐,产生超额收益同时往往也产生了超额的风险,而这正是所谓因子拥挤。本文综合多方面的信息,提供了一种评价因子拥挤程度的方法,值得战略、战术资产配置投资者借鉴。 2.引言 毫无疑问,一系列极端市场事件的发生,包括1998年长期资本管理公司(Long-TermCapital Management)的失败,上世纪90年代末和21世纪初的科技泡沫和破裂,2007年8月的量化危机,以及2009年危机后市场反弹期间动量因素表现的极端下降等,使得学界和业界都意识到因子拥挤的破坏性力量。这些事件虽然不能说是全部,但是在一定程度上是拜策略拥挤所赐:即过多的资本追逐或清算了相同的战略。 与拥挤相关的一个话题是策略的效能(capacity)。虽然效能和拥挤都关心资本规模对给定策略的影响,但效能更侧重于策略的长期收益与风险,而拥挤更关注危机动力学和尾部事件中的策略行为。由于单个策略上的资本存量难以估计,通常拥挤的测度都建立在一些相对基准之上,例如: 一组证券相对于基准证券或者其自身历史价格水平的相对值。 一组证券或基金相对于历史水平的相关性。 一组证券在机构持仓上相对于基准证券或者其自身历史持仓水平的相对值。 需要指出的是,几乎所有的拥挤的研究都围绕着持仓信息和定价-收益信息展开,而本文则基于Bayraktar(2015a)中的讨论。 3.MSCI因子拥挤度量 MSCI综合因子拥挤模型结合了五种因子拥挤度量。这五种度量通过时间上的标准化和加权平均合成了一个评估因子拥挤度的综合分数。给定一种拥挤度量,本文将以每半年为一个观察区间,在随后的24个月中,对因子的收益和波动进行观察。在本文中,因子的大小对应了拥挤程度的高低。因此从指标设计的理念上看,我们当然期望因子拥挤度量负相关于因子未来的收益率,而正相关于因子未来的波动率。这五个因子是: 表1:MSCI因子拥挤度量 3.1.估值价差 显而易见,受资本追逐的证券要比不受追逐的证券更加昂贵,因此估值价差是一个在直观上非常有力的拥挤度的度量。在本文的模型中,该指标衡量的是给定因子后,排名前五分之一的股票相对于后五分之一的股票的昂贵程度。对于BP和SP指标,具体的计算公式是 |qf|qf median(X log ( ≤ 0.2) i i i i )≥ 0.8) median(X 其中log代表自然对数,median代表中位数,X=BP或者SP,i代表股票代码,qf代表股票i的因子分位数(分位数最高为1,最低为0)。在上述公式中,正值越大,因子的拥挤程度就越高,这是因为分母相对于分子较小。此处使用中位数的比值而不是算术差,是因为差值对整体市场估值较为敏感,但比值不会。但由于每股收益在理论上可能变为负值或接近于零,因此EP指标将使用算术差而不是比值来估计因子的拥挤程度如下: i |qf median(X |qf ≤ 0.2) − median(X ≥ 0.8) i i i i 进一步地,需要对上述三种估值拥挤度度量分别进行标准化,并使用其平均值作为最终的估值价差。图一中给出了一些常见因子的估值价差度量与因子未来的收益率和波动性的相关性。 从图中可以看到,几乎所有的高波动性因子——价值、净收益率、规模、Beta和残差波动——在第一个(0-6个月)和第二(7-12个月)6个月时间段内,估值价差度量都与未来收益率存在较高的负相关性,并且正如通常所预料的那样在随后的时间内快速衰减。而估值价差度量与因子未来波动率的关系则表现地不那么一致。 图1估值价差与因子未来收益率和波动的相关性 3.2.做空率差 做空率差衡量了给定因子后,因子水平头尾两端股票的做空比率在筛除价值、规模和动量的影响后的差异。此处的头尾也是使用和估值价差一样的五分位数方法进行划断。由于对冲基金是做空的主力,当股票的做空率上升的时候,这表明对冲基金有可能在该股票上投入了大量资金。 具体来说,利用横截面回归,有如下表达式: SI = a+ k I+kI+kI+kI + ⋯ + kI+ ⋯ + kI+ ⋯ + kI+ ⋯ + kI f Q1Q1,f Q5Q5,f Q1Q1,m Q5Q5,m Q1Q1,v Q5Q5,v Q1Q1,s Q5Q5,s 而最终的做空率差等于 SIS = k − k Q1,f Q5,f 其中I 代表由因子x形成的第j(=1,2,3,4,5)个五分位区间的示性函数当且仅当股票的因子水平属于对应区间时为1否则为0,SI代表做空率,SIS代表做空率差。在数据训练时,本文使用了后继的63个交易日以减少噪声和增加回归系数的稳定性。 Qj,x 在做空率差的正规化处理上,本文使用了依赖于单个因子的均值数据,但使用了不依赖单个因子,而由所有因子共同决定的标准差数据,这样做的原因是为了保留一些因子绝对水平的信息。事实上,此处使用的标准差数据等于所有因子的标准差的算数平均。 图2做空率差与因子未来收益率和波动的相关性 与估值价差类似,在高波动性因子中观察到与因子未来回报相当一致的负相关性,这些因子更容易出现拥挤。 3.3.两两相关 两两相关衡量了给定因子后,因子水平头尾两端股票在筛除市场、规模beta、残差波动因子的影响后的协同性。如果一个因子被大量投资者同时关注,那么处于极端因子暴露水平(较高或较低)分组内的股票收益将呈现较高的相关性。 图3两两相关与因子未来收益率和波动的相关性 具体来说,本文对于因子水平处于头尾的两组股票采取如下操作。对于其中任意一个分组,首先计算单只股票的收益和排除该只股票后该分组中剩下股票的平均收益之间的相关系数,数据区间为过去的63天。此处收益需要将市场、规模、beta和残差波动等等剔除再做分析。然后再计算首尾两端相关系数的平均值。接着,与做空率差类似,利用依赖于因子的平均值和不依赖于因子的标准差计算最后的两两相关度量。 3.4.因子波动 相对波动率衡量的是因子的预期波动率相对于市场波动率的强弱。如果有大量资金青睐于一个因子,那么该因子收益的波动大概率会增加。特别是因子达到转折点或情绪开始转向的时候。具体来说,相对波动率指标定义为Barra USTMM中因子的预期波动率除以市场的预测波动率,然后再进行类似于前述的时间序列标准化。 图4相对波动率与因子未来收益率和波动的相关性 从经验上讲,波动性倾向于聚集或呈现序列相关性,因此有理由期望相对波动率指标与因子未来波动率正相关。而从图中可以看到,几乎所有因子的相对波动性都与因子未来波动呈现正相关性,但当我们拉长观察期,特别是超过12个月时,相关性又呈现出显著的下降关系。而与估值价差和空头率差一样,在因子的未来收益上,不稳定的因子会呈现更大的负相关性。 3.5.因子反转 由于投资者通常有追涨杀跌的倾向,如果一个因子在一段时间内表现良好,则很容易吸引大量的资本。这种现象可能在一开始时确实有利于因子表现,但盈亏同源,也为因子表现地反转埋下了伏笔。异常强劲的因子表现难以永远持续。对于因子反转指标,此处使用了与许多基金业绩评价相一致的为期3年的跟踪窗口。与其他度量一样,此处也对因子反转度量使用了标准化框架。 可以看到,对于高波动率因子,其与因子未来收益的相关性大多为负,而与因子未来波动率的相关性大多为正。 图5:因子反转与因子未来收益率和波动的相关性 4.综合分数 为了得到最后的综合分数,本文综合考虑了上述五种拥挤度量。下图为五种拥挤度量与因子未来收益和波动的相关性的平均值。可以看到,综合分数与因子未来回报和波动性的相关性峰值一般出现在7-12个月的水平,这表明在反转发生之前,市场持续将持续一段时间。 图6: 综合分数与因子未来收益率和波动的相关性 4.1.超越相关 由于对拥挤的关注主要集中在极端事件上,本文单独研究了因子收益大幅下降的发生频率,并将其视为综合拥挤指数的函数。更精细地,本文划定了综合分数在六种不同范围内时,相关因子会在接下来的一年中经历5%或以上回撤的频率。这六种范围分别是: 表2不同综合分数区间 其中综合拥挤分数为-1,-0.5,0,0.5,1对应于7%,20%,50%,80%和93%分位数。 从下图可以看到,当综合分数高于1时,出现5%及以上的因子回撤的概率7.5倍于综合分数小于0.5的情况:此时该概率约为23%。而利用z-分数同样可以得到相似的结果。而更换相关阈值(如2%、10%)和时间期限(如6、18、24个月),同样可以发现类似结果。 图7:综合分数与5%以上因子回撤发生频率分布图 本文还比较了拥挤因子和非拥挤因子在时间上的演进。利用阈值0.5和-0.5,本文将各个因子依据得分高低划分成拥挤的、中性的和不拥挤三类。 可以看到,拥挤的和非拥挤的因子收益率会先发生背离,并在大约6个月左右后达到顶峰,而之后因子收益将趋于收敛。我们观察到类似的波动性行为。而从图上看,拥挤因子的波动性往往最高,同步于收益率6个月后达到峰值。但趣意思的是,非拥挤因子的波动率比中性因子的波动率更高。这一现象的部分原因是,波动率较高的因子会有更加极端的综合分数,因此拥挤的和不拥挤的因子的波动率要高于中性的因子。 图8: 因子收益与波动的时间演进 5.关于动量的更加细致的观察 事实上,动量是在拥挤方面可以说最为有趣的因子。下图绘制了自1998年以来该因子的综合得分和累积因子回归。从图中可以看到,每逢重大市场事件发生,动量指标的综合分数都及时给与了提醒。 图9: 动量因子的历史拥挤水平 例如,在科技泡沫时期,几乎所有的拥挤指标,尤其是估