您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:大类资产配置量化模型研究系列之五:不同协方差矩阵估计方法对比分析 - 发现报告

大类资产配置量化模型研究系列之五:不同协方差矩阵估计方法对比分析

2023-06-28张雪杰、廖静池国泰君安证券劣***
大类资产配置量化模型研究系列之五:不同协方差矩阵估计方法对比分析

协方差矩阵估计方法介绍。协方差矩阵是组合优化方法中的核心输入变量。本文介绍了常用的协方差矩阵估计方法,主要分为无条件和条件协方差估计两类,区别在于是否假定协方差矩阵不随时间变化。无条件协方差估计主要包括样本协方差、压缩估计、随机矩阵模型方法,条件协方差则引入了协方差矩阵的时变特征,主要包括指数加权移动平均、GARCH类方法。 协方差估计效果评价。本文使用三种方法评价协方差的估计效果, (1)计算估计与真实协方差矩阵的均方根误差;(2)基于估计结果在每月末构建最低波动组合,考察样本外波动率表现,波动率越低,协方差估计越精确;(3)基于估计结果在每月末构建目标波动组合,考察样本外波动率表现,波动率越接近目标水平,协方差估计越精确。 在不同场景下的实证分析。分别使用股债商等10个大类资产、中信一级行业指数进行了实证分析。具体来说,(1)从最小波动组合来看,限制卖空下,对于大类资产,基于单指数的压缩估计和DCC-GARCH表现较好;对于中信一级行业,移动加权平均和GARCH类模型的表现较好。(2)从目标波动组合来看,限制卖空下,对于大类资产,压缩估计和CCC-GARCH模型的表现较好;对于中信一级行业,移动加权平均和GARCH类模型的表现较好。(3)从均方根误差来看,大部分方法都对样本协方差有不同程度的改善。综合三种评价方法的结果,对于大类资产,压缩估计和GARCH方法相对样本协方差有一定的改进效果;对于中信一级行业,压缩估计、指数加权移动平均和GARCH方法相对样本协方差有一定的改进效果。 在特定资产配置策略下的实证分析。选用之前系列报告中的Black-Litterman模型、风险平价模型,对比了不同估计方法在特定资产配置策略下的效果。回测结果表明,总体而言,对于两个策略,不同方法的效果区别并不大。我们认为,对于大类资产配置策略,推荐使用较长周期(3-5年)日收益率计算的样本协方差。 风险提示:黑天鹅事件等可能导致大类资产相关性增加,资产配置组合表现不佳;量化模型基于历史数据构建,而历史规律存在失效风险。 国泰君安量化配置团队专注于资产配置量化模型研究。在本系列第一篇《大类资产配置体系简析》中梳理了大类资产配置模型理论发展历程;第二篇《手把手教你实现Black-Litterman模型》中,介绍BL模型的基本理论和编程实现。第三篇《桥水全天候策略和风险平价模型全解析》,介绍桥水全天候策略、风险平价/预算模型的理论和具体实现。 第四篇《基于宏观因子的大类资产配置框架》构造了涵盖增长、通胀、利率、信用、汇率和流动性六大风险的宏观因子体系,并提出一个通用性的宏观因子资产配置框架。本篇报告关注风险估计,首先介绍常用的协方差估计方法,然后对比了不同估计方法在大类资产、中信行业的应用效果,最后展示了之前报告的BL模型策略、风险平价策略采用不同方法的效果差异。 1.协方差矩阵估计方法概述 协方差矩阵是组合优化方法中的核心输入变量。在构建投资组合和进行风险控制时,许多模型是对参数估计结果较为敏感,协方差矩阵估计的精确程度会直接影响模型的表现。 一般情况下,我们假定资产的波动情况和资产间的相关性是恒定的,采用历史样本协方差来估计真实的协方差矩阵,根据大数定律,当样本长度远大于资产维度时,样本协方差矩阵能够收敛到真实的协方差矩阵。而真实情况中,一方面,资产的波动性很可能随时间改变,用历史对未来情况的估计是有偏的,另一方面,当资产维度增加时,很难保证样本长度远大于资产维度,这都使得传统的样本协方差矩阵难以对未来协方差矩阵做出准确估计。 𝑟=𝜇+𝜀 𝑡 𝑡 其中𝑟是t时刻资产的收益率向量,𝜇是资产收益率均值向量,𝜀是均值为0的𝑡时刻收益率随机扰动向量,则t时刻资产收益率的协方差矩阵可表示为Σ=𝜀𝜀。 𝑡 𝑡 ′𝑡𝑡 𝑡 Zakamulin(2015)研究了不同协方差估计方法在国外多个数据集的效果差异;研究发现,基于多元GARCH模型的方法效果最好,指数移动加权平均方法次之,压缩估计和样本协方差效果最差;实际应用中推荐选用指数移动加权平均方法。我们借鉴学术文献和业内常用的协方差估计方法,分别研究在国内资产、行业情景下构建组合的效果差异。 1.1.无条件协方差矩阵估计 1.1.1.样本协方差 协方差估计最基本的方法是使用历史样本协方差矩阵,即过去一段时间的协方差矩阵的简单平均。具体来说,选择过去n期的数据来估计第t期的协方差矩阵,可以按照下面公式计算: 𝑛 1Σ= ′𝑡−𝑖 ∑𝑛 𝜀 𝜀 𝑡 𝑡−𝑖 𝑖=1 1.1.2.压缩估计方法 压缩估计借鉴了贝叶斯估计的思想,将样本协方差矩阵向先验的具有特定结构的目标协方差矩阵压缩,即估计结果为两者的加权和。在目标协方差矩阵上的权重被称为压缩强度。样本协方差是基于历史数据的,估计是无偏的,但当样本长度不够时,估计误差较大;先验的协方差矩阵规定了其特定结构,有设定偏差,但由于待估参数较少,估计误差小。因此,压缩估计是对设定偏差和估计误差的一种平衡。 压缩估计的基本形式表示如下: ( ) Σ=𝛼𝐹+1−𝛼𝑆 F是目标压缩矩阵,S是样本协方差,𝛼是压缩强度,0<𝛼<1。 关于压缩强度的取值,一般通过以下优化问题确定: 2𝐹 ‖ ( ) 𝛼̂=𝑎𝑟𝑔𝑚𝑖𝑛𝛼𝐹+1−𝛼𝑆−Σ ‖ 其中,Σ表示真实的协方差矩阵,根据上式可以基于历史估计的情况选择合适的压缩强度。 压缩估计的表现依赖于选择的目标协方差矩阵,实际情况中,一般根据主观判断和历史经验选择,也可以通过实际数据进行验证。Ledoit和Wolf(2003、2004)先后提出了三种线性压缩目标矩阵,见下面的介绍,投资者可以从中进行选择。 (1)等方差模型 Ledoit和Wolf提出目标压缩矩阵F为一个对角阵,对角元素相等,取值为所有资产方差的平均值。 𝐹=𝜇𝐼 𝑁 ∑𝑁 𝜇= 𝑠 𝑖𝑖 𝑖=1 其中,I表示单位阵,𝑠表示样本协方差矩阵的对角元素,N为资产个数。 𝑖𝑖 如果对样本协方差矩阵进行特征值分解,记𝑈为特征向量矩阵,Λ为特征值对角阵,则压缩估计量可以表示为: ( ) ( ( )) Σ=𝛼𝜇𝐼+1−𝛼𝑆=𝑈𝛼𝜇𝐼+1−𝛼Λ𝑈′ 该压缩估计量实现了将样本协方差的特征值向特征值均值的压缩,减小较大的特征值被高估、较小的特征值被低估的偏误。 (2)单指数模型 Sharpe(1963)单指数模型是将股票收益率拆解为与市场相关的部分以及残差收益率: 𝑦=𝛼+𝛽𝑦 +𝜀 𝑖𝑡 𝑖 𝑖𝑚𝑘𝑡,𝑡 𝑖𝑡 Ledoit和Wolf(2003)提出单指数模型下的压缩矩阵为: 2𝑚𝑘𝑡 ′ 𝐹=𝜎 𝛽𝛽+𝐷 其中𝜎 代表市场收益率的波动率,𝛽是𝑁×1维向量,表示不同资产收益率对市场收益回归的系数,一般取所有资产的等权组合作为市场收益率计算。 𝑚𝑘𝑡 (3)等相关系数模型 Ledoit和Wolf(2004)的等相关系数模型假设资产之间的相关系数相等,设S为样本协方差矩阵,R为样本相关系数矩阵,𝑠和𝑟分别表示其中元素,则 𝑖𝑗 𝑖𝑗 𝑠𝑠𝑠√ 𝑖𝑗 𝑟= 𝑖𝑗 𝑖𝑖𝑗𝑗 对相关系数矩阵的上三角区域求平均,估计等相关系数: 𝑁−1 𝑁 ∑∑ 𝑟̅= 𝑟 𝑖𝑗 ( )𝑁−1𝑁 𝑖=1𝑗=𝑖+1 则压缩目标矩阵F为: 𝑓=𝑠,𝑓=𝑟̅𝑠𝑠√√ 𝑖𝑖 𝑖𝑖 𝑖𝑗 𝑖𝑖𝑗𝑗 1.1.3.随机矩阵模型方法 根据随机矩阵理论,当资产数量相对样本长度较大时,位于一定范围内的协方差矩阵特征根与完全随机的收益序列的协方差矩阵的特征根很接近。 设X是元素独立同分布的随机矩阵(N×T),其样本相关系数矩阵为C。 𝑇𝑁 当→𝑄时,当N和T趋近于无穷时,矩阵C的特征根分布具有如下密 度函数: 𝑄 ()𝑝𝜆= √(𝜆2𝜋𝜆 =(1+√𝑄 −𝜆)(𝜆−𝜆 ), 𝜆 <𝜆<𝜆 𝑚𝑎𝑥 𝑚𝑖𝑛 𝑚𝑖𝑛 𝑚𝑎𝑥 −1 −1 其中,𝜆 ),𝜆 =(1−√𝑄 )。 𝑚𝑎𝑥 𝑚𝑖𝑛 这表明,如果一个矩阵完全随机,不包含有用的信息,其特征值应该介于以上阈值之间,服从以上分布函数。因此,把样本协方差矩阵的特征根分布与以上分布相比,如果样本协方差矩阵的特征根介于以上阈值,则认为是随机性导致的,视为噪声,应该过滤掉;而样本协方差矩阵特征根中超出该分布的,则认为其含有信息。 具体地,对于样本相关系数矩阵C,设其特征根为𝜆,𝜆,…,𝜆,且𝜆> 𝑁 {} 𝜆>⋯>𝜆,𝜉为相应的特征向量,假设前k个特征值大于𝜆据随机矩阵理论,应该保留大于𝜆 ,根 𝑁 𝑖 𝑚𝑎𝑥 的特征根,剔除其他特征根,在的特征根替 𝑚𝑎𝑥 这里,为了保证相关系数矩阵的迹不变,将所有小于𝜆换为所有小于𝜆 𝑚𝑎𝑥 的特征根的平均值。调整后的相关系数矩阵为: 𝑚𝑎𝑥 𝑘 ′𝑖 ̅𝐶= ∑ 𝜆𝜉𝜉+𝛼𝐼 𝑖𝑖 𝑖=1 𝜆 +⋯+𝜆𝑁 𝑘+1 𝑁 𝛼= 则调整后的协方差矩阵为: 1/2 1/2 ̅𝐶𝐷 Σ=𝐷 其中D为对角线元素为样本方差的对角矩阵。 随机矩阵模型方法通过调整样本相关系数矩阵的部分特征值大小,去除了一部分估计噪声,理论上能够降低估计误差。 1.2.条件协方差矩阵估计 上文我们介绍了多种无条件协方差矩阵估计方法,这些方法假设协方差矩阵是不随时间变化的,另一类估计方法认为资产的波动率和相关性会呈现出时变规律,使用时间序列模型对协方差矩阵建模,称为条件协方差估计。 考虑多元收益率序列{𝑟}, 𝑡 𝑟=𝜇+𝜀是𝑟在给定过去信息𝐹 𝑡 𝑡 𝑡 (| 这里𝜇=𝐸𝑟𝐹 ) 下的条件期望,向量𝜀是资 𝑡 𝑡 𝑡−1 𝑡 𝑡−1 𝑡 产序列在t时刻的扰动或新息。条件协方差矩阵估计关注Σ随时间的演变,在给定𝐹的条件下估计Σ。 𝑡 𝑡−1 𝑡 (|Σ=𝐶𝑜𝑣𝜀𝐹 ) 𝑡 𝑡 𝑡−1 1.2.1.指数加权移动平均协方差 最常见的时变模型是指数加权移动平均估计,该估计的思想是越靠近当前时刻的新息相关性越大,应该赋予更高的权重,用指数平滑的思想给出如下估计,加权系数随时间呈指数式递减。 𝑡−1 1−𝜆1−𝜆 𝑗−1 ′𝑗 ∑ Σ= 𝜆 𝜀𝜀 𝑡 𝑗 𝑡−1 𝑗=1 𝑡−1 其中0<𝜆<1且保证了权重之和为1,当t充分大时,𝜆也可以改写为: ≈0,上式 ′ 𝑡−1𝑡−1 ( ) Σ=1−𝜆𝜀 𝜀 +Σ 𝑡 𝑡−1 𝜆的取值会影响模型的表现,J.P. Morgan1996年基于在险价值(VaR)建模时提出了RiskMetrics模型,通过估计方差或协方差来预测市场风险,其中在使用日频数据估计协方差矩阵时,使用了指数加权移动平均方法,并将𝜆设为0.94。 1.2.2.多元GARCH模型 1.2.2.1.VEC-GARCH模型 将已有的一元GARCH模型推广到多元是条件协方差估计中的另一类方法,对波动率进行时间序列建模来提取其中的时变特征。最基本的是Bollerslev(1988)提出的VEC模型(VectorGARCHmodel),VEC模型实际上是对协方差矩阵中的每个元素都建立一元GARCH模型,组合起来形成对下一期协方差矩阵