
风险平价策略是一种强调在投资组合各资产中均衡风险,而不考虑资产收益率的策略。但有时即使该策略平衡了风险贡献,部分资产的风险来源也可能是相同的,高度集中的风险来源往往会使得投资组合暴露在较高的风险之下。 作者通过将x-means与k-means++这两种非层次聚类算法相结合,得到具有较好聚类稳定性的x-means++算法,再结合传统的风险平价策略,构建出了一个新的资产配置模型。模型假设价格走势相近的资产具有共同的风险来源,于是它能够很好地平衡每个聚类(即每个风险来源)以及聚类中每个资产的风险贡献。 作者通过实证分析,利用全球15种股指期货以及12种国债期货的数据,证明该模型的盈利能力和风险控制能力均要优于传统的风险平价策略或是层次聚类风险平价策略。 1.选题背景 资产配置是投资中最重要的环节之一,通过在高风险、高收益的资产(一般包括股票等权益工具)以及低风险、低收益的资产(一般包括债券等债务工具)中进行多样化的投资,使得投资组合能够在获取较高的收益的同时暴露在较小的风险之下。如何配置组合中各资产的权重,是资产配置的核心问题。 本篇报告介绍的文章《Asset Allocation Strategy with Non-Hierarchical Clustering Risk Parity Portfolio》提出了一种具有较好聚类稳定性的x-means++算法,将其与传统的风险平价策略相结合,为投资者们提供了一个新型的资产配置模型。 2.核心结论 作者首先使用非层次聚类算法对资产进行分组,算法选择上,作者通过将x-means与k-means++这两种非层次聚类算法相结合,提出了一种新型的x-means++算法,其划分的聚类具有较好的稳定性。 之后,作者结合传统的风险平价策略,构建出了一个基于非层次聚类的风险平价模型。模型假设在一定时间段内收益率走势相近的资产具有共同的风险来源,于是它能够很好地平衡每个风险来源的风险贡献。 作者利用全球15种股指期货以及12种国债期货的数据进行实证分析,证明了该模型的盈利能力和风险控制能力均要优于传统的风险平价策略或是层次聚类风险平价策略。 3.文章背景 在资产配置领域中,比较经典的模型是Markowitz(1952)的均值-方差(Mean-Variance)模型,即在给定预期收益率下最小化风险(方差),或在给定风险水平下最大化收益。但该模型在实践中往往会使得部分资产分配到过大的权重,以至于收益和风险都集中在这些资产上,同时,组合对收益率十分敏感,收益率细微的变动会造成完全不同的组合。由于存在这些不足,很多投资者倾向于使用不考虑资产预期收益率而仅仅考虑资产风险的策略,常见的策略包括最小方差组合和风险平价(Risk Parity)策略。其中,风险平价策略由Edward Qian(2005)提出,核心思想是通过调整权重,使得组合中各类资产的风险贡献基本均衡,他通过实证分析证明了该策略比将股票、债券按传统的60:40的比例进行投资拥有更高的夏普比率。此外,这一思想也被桥水基金运用于实际投资中,获得了令市场瞩目的收益。 与此同时,也有一些学者认为这个策略有所不足,Meucci (2009),Uchiyama,Kadoya和Nakagawa(2019)提出,即使风险平价策略能够平衡每个资产的风险贡献,这些资产的风险来源也未必是多样的。也就是说存在部分资产的风险来源是相同的可能性,如此一来,高度集中的风险来源会使得投资组合暴露在较高的风险之下。 本文为解决这个问题,采用了非层次聚类的方法,将具有相同风险来源的资产分为一类,首先考虑每个聚类的风险贡献均衡,然后再在各聚类之中平衡风险。 4.数据来源与模型构建 本文收集了全球范围内15种股指期货和12种国债期货的价格数据,时间跨度为2001年4月至2020年5月。所选股指期货标的包括标普500指数、纳斯达克综合指数、日经225指数、东证指数等,国债期货标的包括美国2年、5年、10年国债,日本10年国债等,具体见表1。 表1:投资资产 4.1.X-means++算法 K-means是一种常用的非层次聚类算法,给定聚类数量k和k个初始质心(聚类的中心点),它能够通过不断地调整质心将数据分为k类,算法的核心在于最小化下面这个函数: 𝑘 ∑∑ (𝑑(𝑥,𝐶)) 𝑖 𝑖=1𝑥∈𝐶 𝑖 其中,𝐶表示第i个聚类的质心,𝑥 ∈ 𝐶表示数据x属于第i个聚类,𝑑(𝑥, 𝐶)表示数据x到质心𝐶的距离。 𝑖 𝑖 𝑖 𝑖 但是,k-means有两个缺陷:第一,很多时候我们并不知道数据该分为多少类,聚类数量k难以给定;第二,分类结果依赖于初始的k个质心,若初始值选的不好,有时会陷入局部最优解的问题。 针对这两个缺陷,作者提出了x-means++算法,是x-means算法与k-means++算法的一种结合,四种算法的对比见表2。 表2:k-means,k-means++,x-means与x-means++算法的对比 4.1.1.x-means x-means算法解决了k-means算法的第一个缺陷,通过它可以确定出最佳的聚类数量。本文应用了Ishioka(2006)提出的以下算法步骤: 第一步,准备样本数量为n的p维数据。 第二步,应用k-means(取𝑘 = 2),将划分后的聚类命名为𝐶,𝐶。 第三步,i分别取1和2,重复第四步到第九步。 第四步,对聚类𝐶,继续应用k-means(取𝑘 = 2),将划分后的聚类命名为𝐶,𝐶。 𝑖 12𝑖𝑖 第五步,对属于𝐶聚类的𝑥,假设其服从p维正态分布: 𝑖 𝑖 1 exp[− 𝑇−1𝑖 ( )𝑓𝑥;𝜃= (2 ) ( )𝑥−𝜇] 𝑥−𝜇 𝑉 𝑝2 𝑖 𝑖 𝑖 (2𝜋)√det|𝑉| 𝑖 于是可以求出BIC信息量: ( ) 𝐵𝐼𝐶=−2log𝐿𝜃;𝑥∈𝐶+𝑞log𝑛 𝑖 𝑖 𝑖 𝑖 其中,𝜃= [𝜇,𝑉]是p维正态分布的极大似然估计,𝜇是均值,𝑉是𝑝 × 𝑝维的协方差矩阵;q是模型的参数个数,即𝑞 = 𝑝(𝑝 + 3)/2;𝑛是𝐶中的样本数量;𝐿是似然函数,即𝐿(∙) = ∏ f (∙)。 𝑖 𝑖 𝑖 𝑖 𝑖 𝑖 𝑖 1𝑖 2𝑖 第六步,对属于𝐶和𝐶聚类的数据x,同样假设其服从p维正态分布, (1)𝑖 (2)𝑖 1𝑖 2𝑖 其中𝐶的参数为𝜃,𝐶的参数为𝜃。x服从的概率密度函数为: (1)(2)𝑖𝑖 (1)𝑖 (2)𝑖 𝛿 1−𝛿 𝑖 𝑖 ( 𝑔𝑥;𝜃 ) ,𝜃 =𝛼[𝑓(𝑥;𝜃 )][𝑓(𝑥;𝜃 )] 𝑖 其中, 1𝑖2𝑖 1,如果𝑥属于𝐶{ 𝛿= 𝑖 0,如果𝑥属于𝐶 𝛼是一个能让(4)式成为概率密度的常数(0 ≤ 𝛼≤ 1)。作者对它进行了估计: 𝑖 𝑖 𝛼=0.5/𝐾(𝛽) 𝑖 𝑖 其中,𝛽是两个聚类之间标准化后的距离: 𝑖 ||𝜇−𝜇||√𝛽= 1 1 2 2 𝑖 || 𝑉+|𝑉| 𝐾(∙)是一个要求自变量大于0的正态分布函数。于是可以求出BIC信息量: ′ ( ) 𝐵𝐼𝐶=−2log𝐿′𝜃′;𝑥∈𝐶+𝑞log𝑛 𝑖 𝑖 𝑖 𝑖 (1)(2)𝑖𝑖 其中,𝜃′ = [𝜃 ,𝜃 ]是p维正态分布的极大似然估计;q是模型的变 𝑖 量个数,由于每个p维变量都有均值和协方差两个参数,所以𝑞 = 𝑝(𝑝 + 3);𝐿’是似然函数,即𝐿′(∙) = ∏ g (∙)。 1𝑖 第七步,如果𝐵𝐼𝐶 > 𝐵𝐼𝐶′,认为对𝐶做二次划分是有意义的,令𝐶= 𝐶,𝐶储存进一个堆栈,然后回到第四步。 𝑖 𝑖 2𝑖 2𝑖 第八步,如果𝐵𝐼𝐶 ≤ 𝐵𝐼𝐶′,认为对𝐶做二次划分是没有意义的,将𝐶从堆栈中取出,令𝐶= 𝐶,然后回到第四步。如果堆栈中无聚类可以取出,则继续进行第九步。 𝑖 2𝑖 𝑖 第九步,对𝐶中所有的聚类重新编号。 𝑖 第十步,将𝐶,𝐶中所有的聚类重新编号,于是可以得到最佳的聚类数量。 4.1.2.k-means++ K-means++算法解决了k-means算法的第二个缺陷,通过它可以确定出k个初始质心,具体的算法步骤如下: 第一步,在n个数据中随机选择一个初始质心𝐶。 第二步,对每一个数据𝑥,计算它到离它最近的质心的距离𝑑(𝑥)。 𝑖 𝑖 第三步,在其余n-1个数据中随机选择一个数据作为新的质心。数据𝑥被选中的概率为: 𝑝 𝑛−1 ∑(𝑑(𝑥))/ (𝑑(𝑥)) 𝑝 𝑖 𝑖=1 这一步的核心思想是“离质心越远的数据有越大的概率被选为新的质心”,而已经是质心的数据被选为新的质心的概率为0,这个思想符合我们想要对数据进行分类的目的。 第四步,重复第二步和第三步直到k个质心被挑选出来。 4.2.非层次聚类风险平价策略 4.2.1.风险平价策略 对于收益率协方差矩阵为 Σ的n个资产的配置问题, 在传统的风险平价 𝑇 策略中,我们这样去决定它们的权重𝑤 = (𝑤, … , 𝑤):对资产i,定义它的边际风险贡献𝑀𝑅𝐶: 𝑛 𝑖 (𝑀𝑅𝐶= Σw) 𝑖 𝑖 𝜎 𝑝 𝑇 其中,𝜎= √𝑤Σ𝑤,表示资产组合的整体风险。 𝑝 接着继续定义资产i的风险贡献𝑅𝐶: 𝑖 𝑅𝐶=𝑤×𝑀𝑅𝐶 𝑖 𝑖 𝑖 风险平价组合要求来自每个资产的风险贡献都是相等的: 𝑅𝐶=𝑅𝐶, ∀𝑖,𝑗 𝑖 𝑗 在限制卖空的约束下,可以把它看成一个如下的凸优化问题: 𝑛 𝑛 ∑∑min (𝑅𝐶−𝑅𝐶) 𝑖 𝑗 𝑤 𝑖=1𝑗=1𝑛 ∑ 𝑠.𝑡. 𝑤=1,𝑤>0 𝑖 𝑖 { 𝑖=1 4.2.2.非层次聚类风险平价策略 在本文中,作者希望均衡来自每个聚类的风险,在使用x-means++算法对资产进行分类后,可以得到聚类数量k,和第j个聚类中的资产数量𝑵。于是,非层次聚类风险平价策略的优化模型如下: 𝒋 𝑘 1(𝑅𝐶−×𝑘 1𝑵 ∑∑min ) 𝑖 𝑤 𝒋 𝑗=1𝒊∈𝒋𝑛 ∑ 𝑠.𝑡. 𝑤=1,𝑤>0 𝑖 𝑖 { 𝑖=1 其中,𝒊 ∈ 𝒋表示资产i属于聚类j,从模型上看,策略逻辑是先在k个聚类中均衡风险,然后再在每个聚类的资产中将该聚类的风险平分,这样就能确保来自同一风险来源的风险贡献均等。 5.实证分析 5.1.实证方法 作者使用了年化收益率、年化风险(收益率的标准差)、收益风险比以及最大回撤作为衡量策略好坏的指标,具体的公式如下: 𝑇 250𝑇 ∑ 𝑅𝑒𝑡𝑢𝑟𝑛= 𝑟 𝑡 𝑡=1 𝑇 250 √𝑅𝑖𝑠𝑘= ∑𝑇−1 (𝑟−𝜇) 𝑡 𝑡=1 𝑅/𝑅=𝑅𝑒𝑡𝑢𝑟𝑛/𝑅𝑖𝑠𝑘 𝑊 max𝑊 𝑘 𝑀𝑎𝑥𝐷𝐷=min(0, −1) 𝑘∈[1,𝑇] 𝑗 [ ]𝑗∈1,𝑘 其中,𝑟代表一年中第t天的组合收益率,𝜇代表一年的平均收益率,𝑊代表组合在一年中第k天的净值。 𝑡 𝑘 作者具体的实证分析分为以下几个步骤: 第一步,根据当前时点前250个交