
一)马氏距离划分经济情景 二)不同情景下预测行业涨幅 三)分情景行业组合表现更优 使用情景分析方法划分经济状态 在不同的宏观经济状态下,行业运行的驱动力和逻辑往往会有差异。因此先区分不同的经济情景状态,再在不同情景下建模预测行业走势,可能会有更好效果。 均值-方差模型理论上可以覆盖所有可能的情景,但参数并不直观、且较难准确估计。 相比之下,情景分析方法(Scenario Analysis)只给出少数几种情景及概率,更加直观。 情景分析的缺点是过程中主观因素较多,例如情景种类的划分、情景概率的量化。如果能通过量化手段确定情景分析方法的主要变量,那么这一方法将更容易执行。 Czasonis & Kritzman(2020)等提出了一种方法,使用马氏距离对经济数据做情景分析,以量化方式给出情景发生的概率。我们参考这一方法并做出改进,在情景分析的基础上完成行业轮动策略,取得了较好效果。 马氏距离的概念 马氏距离与欧式距离相似,是一种常用的距离度量指标。它的优点是消除了不同维度量纲差异的影响,同时也考虑了不同维度之间的相关性。 马氏距离常用于度量市场运行中的异常波动。选定一组刻画市场状态的变量,当它们与 定义经济情景 我们基于CPI等9类经济数据,将经济情景定义为高增速、正常增速、低增速,共3种类型。 对于每类经济数据,根据实际含义确定它与经济增速的方向关系。例如通胀率为同向指标,当指标较高时,对应经济增长较为景气,即高增速;长短期限国债利差则为反向指标。 对于每类经济数据,在每个时点滚动选取较新的一段历史数据。在剔除超过最高和最低分位数阈值的数据后,将剩余数据的中位数用于定义正常经济增速;将中位数±1.5倍标准差分别对应经济高增速和经济低增速(具体正负号与数据方向有关)。 经济情景与具体数值 表1作为示例,展示了通过9类数据对经济情景的定义。 以上经济数据通过了对单个行业指数的显著性检验,即至少对一个行业指数的回归显著性P-Value < 0.1。 经济数据到情景概率的转换 我们重新阐述马氏距离计算公式中的变量: 在上式中,将𝑥视为在目前经济数据下对未来3种经济情景的量化定义,γ为经济数据当前值。根据3组经济数据值,就可得到3个距离,即𝑑,𝑑,𝑑。 低增速 正常增速 高增速 在每组经济数据服从多元正态分布的假设下,可以通过指数函数建立起情景概率与马氏距离之间的联系,即情景概率与𝑒成正比。经济情景定义值与当前值的马氏距离越远,该情景发生的概率就越低。 −𝑑/2 −𝑑/2 通过指数函数𝑒情景概率。 得到3种情景概率初步值后,再将其归一化,就可以得到最后的经济 可以看出这一方法计算得到了未来经济情景发生的概率,基于的内在逻辑是认为经济数据会在一段时间内有动量延续特征,从而将经济情景值与当前值的差距转换为概率值。 一)马氏距离划分经济情景 二)不同情景下预测行业涨幅 三)分情景行业组合表现更优 按经济情景将数据分组 我们在3种不同经济情景下分别对经济数据与行业指数建模。从2012年开始,使用马氏距离方法计算每个月的情景概率,取3种情景的概率最大者为划分结果,并将对应数据纳入该分类的训练集中。 图2:经济数据与对应的经济情景 由于将全部经济数据根据多个经济情景做了拆分,因此每个情景的训练集长度会有所减少。为了能够让训练集累积更长,我们在2018年之前只划分情景分类而不做预测,从2019年开始同时划分情景并做预测。 同步预测与滞后预测 通常在使用宏观数据预测行业走势时,由于宏观数据公布存在滞后,一般会使用滞后预测,即T-1期(滞后一期)或更早期的宏观数据与T期行业指数建模。 但在市场实际运行中,对行业走势有直接影响的一般是同期经济数据变化,而非滞后期的数据。同期经济数据对行业走势会有更高的解释力度,预测也更有优势。 我们以沪深300指数月涨幅为被解释变量,将表1中的经济数据分别作为同步和滞后一期解释变量使用,计算两个回归方程的R²,同步回归的解释力度明显更高。 同步预测前提条件:预测解释变量 尽管同步回归的解释力度更高,但因为需要提前预测解释变量,例如经济数据,因此在实际应用中存在困难。 在前述过程中,我们得到了未来3种经济情景数值和发生的概率,因此可以直接将经济情景对应数值作为解释变量的下期预测值,从而能够使用同步回归预测行业指数走势。 尽管未来经济情景数值的核心是基于动量延续的假设,但与在常规同步回归预测中直接使用T-1期解释变量值替代T期值(同样是动量)相比有两个优点: 经济情景对应数值是基于历史数据分布得到的,比单期数据简单动量更加稳健; 在3种经济情景下建立3个回归模型,预测结果通过情景概率加权,更加稳健。 行业轮动组合构造流程 我们选择申万一级行业(剔除综合行业)作为行业轮动组合备选标的,每月末在3种经济情景下对经济数据与行业指数涨幅建模,并预测下个月指数涨幅,回归方法为岭回归。 在高增速、正常增速、低增速3种经济情景下,使用同步回归对训练集建模,为了排除未来信息,T月末只能使用最晚为T-1月的经济数据与T-1月的行业指数涨幅进行回归。 得到3个回归方程后,分别将高增速、正常增速、低增速3种经济情景对应的经济数据作为解释变量的预测值,计算3种情景下的行业指数涨幅预测值。再使用经济情景概率值对预测结果加权求和,得到最终预测涨幅。选择最终预测涨幅排名前5名的行业作为结果,等权加权。 行业轮动组合流程图示 一)马氏距离划分经济情景 二)不同情景下预测行业涨幅 三)分情景行业组合表现更优 行业轮动组合表现较好 行业轮动组合表现较好,2019年至2022年9月16日,行业轮动组合上涨119.38%,同期全部行业(剔除综合)等权组合上涨45.14%,行业轮动组合超额收益为51.15%。 分情景同步预测实际表现更优 在解释变量相同的情况下,分情景同步预测行业组合表现优于滞后预测(区分经济情景)、滞后预测(不分经济情景)两种预测方法。 模型特点总结 模型优势: 能够区分不同经济情景之下的行业走势规律。 可以探寻同步经济变量与行业间的走势规律,解释力度更高。 模型待改进之处: 对经济情景的区分仍基于历史统计规律,前瞻性存在不足。 预测结果对所选择的解释变量仍然敏感。 (3)目前对全部行业都使用了同一组解释变量,根据行业特征选择不同的解释变量可能有更好效果。 风险提示 量化报告的结论基于历史统计规律,当历史规律发生改变时,报告中的模型和结论可能失效。