您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:精品文献解读系列(三十三):因子择时模型的泛用框架 - 发现报告

精品文献解读系列(三十三):因子择时模型的泛用框架

2022-08-26国泰君安证券上***
精品文献解读系列(三十三):因子择时模型的泛用框架

投资学是一门学术界与业界紧密结合的学科,其中大类资产配置是这种紧密结合的代表。从Markowitz(1952)开创现代投资组合理论开始,学术界为业界提供了丰富的理论参考和方法模型,推动了大类资产配置实践的繁荣发展。为了帮助读者及时跟踪学术前沿,我们推出了“精品文献解读”系列报告,从大量学术文献中挑选出精品论文进行剖析解读,为读者呈现大类资产配置领域最新的思路和方法。 本篇为读者解读的文献是Hua et al.(2012)在Journal of Portfolio Management上发表的论文"Factor-Timing Model"。 本报告利用Akaike信息准则通过逐步纳入条件变量,将静态因子模型的最优化框架推广成了一个泛用的因子择时模型。进一步地,本报告还导出了一些信息比率指标,用于追踪该因子择时模型的改进效率,并对改进各种途径的影响进行了分析。 对于多因子模型这种静态因子模型而言,其核心逻辑即寻找收益较高但风险较低的因子进行趋势配置。但本报告表明,收益较低而风险较高的因子同样具有策略价值。在联合正态分布的假设下,通过引入条件变量,本报告对价值策略、质量策略和热点策略使用的主要因子,利用条件模型的一般范式,构建了因子择时模型,值得战术资产配置者参考。 风险提示:量化模型基于历史数据有失效风险。 1.文献概述 文献来源: Hua, R. ,D. Kantsyrev , and E. Qian. "Factor-Timing Model." Journal of Portfolio Management 39.1(2012):75-87. 文献摘要: 本报告利用Akaike信息准则通过逐步纳入条件变量,将静态因子模型的最优化框架推广成了一个泛用的因子择时模型。进一步地,本报告还导出了一些信息比率指标,用于追踪该因子择时模型的改进效率,并对改进各种途径的影响进行了分析。 文献评述: 对于多因子模型这种静态因子模型而言,其核心逻辑一言以蔽之即寻找收益较高但风险较低的因子进行趋势配置。但本报告表明,收益较低而风险较高的因子同样具有策略价值。在联合正态分布的假设下,通过引入条件变量,本报告对价值策略、质量策略和热点策略使用的主要因子,利用条件模型的一般范式,构建了因子择时模型,值得战术资产配置者参考。 2.引言 自2007年大萧条和2008年金融危机以来,全球金融市场进入了一个伴随以极端宏观条件、波动率大幅提升、多市场相关性增强、货币和财政政策反馈不确定性频发的未知时期。在此情况下,一些传统的静态权益投资策略陷入苦战,很大程度可以归因于其在某些量化因子上的不当行为。 在静态量化模型中,因子权重通常基于长周期视角下的风险回报统计量,并在短时间内难有较大的边际变化。因此,尽管静态量化模型能在长周期中最终呈现良好表现,但也同时容易受到那些在短期内对模型或者因子表现有不利影响的市场因素的影响。 例如随着市场波动的持续,静态模型可能会面临业绩困难。而本报告发现,此时投资者可以通过因子择时模型获利。事实上,该模型成功将市场波动率转化为全新的超额收益来源。 与静态模型的最大区别在于,动态模型的因子权重依赖于一组市场条件变量的时变信息。例如S&P500的隐含波动率指标VIX可以视为一个条件变量:当VIX较高时,更应该逆市做多风险较高、同时做空动量较强的股票;而当VIX相对较低的时候,反其道而行之则可能更加有效。但无论如何,该策略的有效性取决于VIX指标对动量的预期收益率和方差、估值和其他量化因子的影响。 显然,因子择时模型的权重依赖于收益率的条件期望和条件协方差。由于市场条件随时而变,因子择时模型给出的最优权重自然也就随时而变。 而给定一个静态模型后,为了构造相应的因子择时模型,还需要给定条件变量集和触发机制。此处采用的动态触发机制类似于Qianet al.(2004)中的既有框架,而本报告的主要创新在于提供了一套如何筛选条件变量的方法。同时,本报告还通过导出有用的信息比率指标,展示了如何跟踪模型改进,并验证了该动态模型如何提升组合业绩。 本报告的目标是构建一个泛用的、依据逐步增加的条件变量来进行因子择时的模型。相比之下,现有文献往往关注如何使用条件变量来提升动态资产配置策略的业绩,两者视角确有不同。 3.因子择时模型的最优权重 本报告关注的变量主要有两种,即因子收益率(factorreturn)和条件变量(conditionalvariable)。令 ) R{ = (R)V= (V = N个因子的时序收益率= K个条件变量的时序取值 t+1 t+1N×1 t tK×1 为方便起见,后文总是在不至于混淆的情况下省略时间脚标。本报告总是假设因子收益率与条件变量服从多元正态分布 ΣΣ ΣΣ R R̅ () ∼ N (() , (V V̅ RR VR RV VV )) 假设v是条件变量V的一个具体实现,根据条件期望公式,可以将R的条件均值(conditionalmean)和条件协方差(conditionalcovariance)写作 R= R̅ + ΔR{ |v|v Σ= Σ − Σ RR ΔΔ 其中 −1 VV−1 VV (v − V̅) ΔR = ΣΣ{ RV RV Σ = ΣΣΣ ΔΔ VR 分别称为因子收益和协方差的调整项。而条件模型最优权重(conditional model optimal weights,CMOW)为 ∗|v −1|v M= λΣR |v 其中λ是某个由最优化过程决定的常数(此处其实是最优化组合的信息比率)。从公式可以看出,动态模型与静态模型的区别在于因子收益率的调整项ΔR和协方差矩阵的风险约化部分Σ。 ΔΔ 4.条件变量的选择 研究模型排序的文献汗牛充栋。由于一个具体模型往往由变量的选择、参数的估计以及逻辑结构的嵌套方式等具体特征所刻画,因此对于特定问题而言,候选模型的适定性当然取决于先验的筛选逻辑。但金融市场过于复杂,通常很难找到一个一劳永逸的模型,因此只能寄希望于一组能从不同侧面,洞见市场动力机制和内部运作模式的近似模型作为替代。 如何依据先验知识,普世地寻找最优模型的方法显然超出了本报告的能力范围。这方面的成功例子依赖于研究者的经验、知识和创造力。总体来说,研究者需要平衡“一大一小”两方面的需求:一方面需要关注可信假设,使得候选模型集尽可能地小;另一方面则要保证候选模型集有适当的规模,以免遗漏那些合理的先验模型。 在本报告关注的条件变量的选择问题上,增加条件变量的数量虽然会增加模型的拟合精度并降低样本内残差,但同时也会增加模型的样本外预测误差并降低拟合的可处理性。本报告提供了一种基于Akaike信息准则的条件变量筛选方法,尝试解答“到底需要纳入多少条件变量”这一现实问题。 4.1.Akaike信息准则 自从19世纪热力学首次引入熵(entropy)的概念以来,该概念在包括信息论在内多学科内已经有了广泛使用。1951年,Kullback和Leibler提出了一种用来衡量两个模型之间差异的测度,即大名鼎鼎的KL散度。 Akaike(1973)发现了KL散度和Fisher的极大对数似然之间的关系,并据此提出了一种用于筛选模型的方法。这种度量被Akaike称之为信息准则(Akaikeinformation criterion,AIC),形式上是信息熵和模型复杂度的数量和: AIC = −2 ln L + 2κ 其中L代表估计模型的似然函数,而κ代表模型的参数个数。粗糙地讲,AIC越小的候选模型越接近真实情况。 本报告中,因子择时模型的AIC形如 |] + 2NK AIC = T ⋅ ln[|Σ |v 其中T是观察的样本数,N代表量化因子个数,K代表条件变量个数,其中似然函数由条件协方差矩阵的行列式给出 |Σ| = det(Σ) |v |v 我们在此处简要给出因子择时模型AIC的推导过程。设因子收益率,条件收益率和残差收益率之间的关系如下 R = R+ ε |v t 特别地,我们假设残差收益率是独立同分布且对于时间序列𝑡 = 1,2, … , 𝑇保持序列无关性(虽然此条件可以放宽,但技术上我们需要用到偏似然估计),那么对于条件v而言,有似然函数 T T−1 t|v ] L(v) = ⋅ exp[− ⋅ ∑ εΣε2 t T/2 NT/2 (2π) |Σ| |v t=1 其中指数部分有近似估计 T T−1 t|v T−1|v ∑ ε Σε≈ T ⋅ 𝔼[εΣε] = TN t t=1 代入后有 −T/2 −NT/2 −1|v | L(v) = (2πe) ⋅ |Σ 再注意到协方差矩阵的自由度为N(N + 1)/2,而条件变量与因子收益之间的关联自由度为NK,因子的截距自由度为N,因此未化简的AIC为 |] + N(N + 1) + 2NK + 2N AIC̃ = NT ⋅ [ln 2π + 1] + T ⋅ ln[|Σ |v 将与条件变量(v或者K)无关的常数去掉,最后即有 |] + 2NK AIC = T ⋅ ln[|Σ |v 更进一步,在分量上有 ) = (σ ) = D Σ= (σ σρ ρD |v ij|v i|vj|v ij|v |v|v|v 其中 ), D= diag(σ ,… , σ ρ= (ρ ) |v 1|v N|v |v ij|v 分别是条件标准差组成的对角阵和条件相关系数矩阵。 从AIC的上述形式可以看到,在T和N给定的情况下,条件变量个数K和协方差矩阵的行列式将在相反方向上影响AIC。注意到 2 i|v |Σ| = det(Σ) = det(D ) det(D )det(ρ ) = |ρ| ⋅ Πσ |v |v |v |v |v |v i 因此当K越大时,数据拟合将越精细,因此资产条件方差将会变得越小,其行列式将变得更小,但由于AIC指标中的第二项包含了条件变量数作为惩罚项,因此一味提升条件变量的个数可能会使AIC不降反升。 从AIC的具体形式出发还可以得到一些有意思的推论。例如,假设资产之间的相关性都为0,那么协方差阵是资产方差形成的对角阵,因此有 ) + 2NK AIC = 2T ⋅ ln(σ ⋯ σ 1|v N|v 故而当条件变量数K固定时,最优模型等于所有方差乘积最小的模型。 再注意到协方差矩阵是个半正定阵,因此行列式在最极端的情况最小等于0,此时的AIC则趋于负无穷。 需要注意的是,有两种比较简单的情况会使得AIC等于负无穷。第一种情况,是某个因子的条件方差为零,此种情况代表模型可以精确预测某个因子收益。换而言之,利用该因子收益率,可以设计一个无风险套利组合。第二种情况则是条件协方差矩阵退化,此时利用共线性性,同样可以通过抵消某些因子回报设计出一个无风险套利组合。 更有意思的是,如果考虑条件协方差矩阵的特征值 λ≥ λ≥ ⋯ ≥ λ≥ 0 N 注意到 |Σ| = λ ⋯ λ |v N 那么 ) + 2NK = T ⋅ ∑ ln λ AIC = T ⋅ ln(λ⋯ λ + 2NK N i 上述公式表明,一个优秀的条件变量会带来条件协方差矩阵特征值的大比例衰减(简单来说就是衰减的比例而非幅度才是决定条件变量优劣的标准,将某个因子收益标准差从100衰减为50和从1衰减到0.5在AIC上的效用是一样的)。因此条件变量应该选择那些在协方差上解释力度更显著的变量。 上述讨论主要是站在风险约化的视角,聚焦于如何依据AIC指标选择最优的因子择时模型。但作为同一枚硬币的另一面,条件因子收益R也会受到AIC的影响,而且我们最终将会看到,这种影响表现为一系列的信息比率指标,从而决定因子择时模型的效率。 |v 4.2.条件变量选择的步