AI智能总结
从行业整体、个股特征、资金流向三个角度出发,对行业拥挤度进行度量。我们认为,可以从行业整体、个股特征、资金流向三个角度对行业拥挤度进行刻画,并据此构建了量价相关性、配对相关性、买卖非均衡等指标,用于后续进一步筛选。 通过拥挤度指标处于高位区间时未来一个月行业超额收益的均值和超额收益为负的胜率综合判断指标效果,对每个行业单独筛选指标。 我们认为,拥挤度这一概念主要用于规避交易过于拥挤带来的下跌风险,而低拥挤行业则不一定能够有超额收益。因此,我们不应衡量指标在全样本区间对行业未来超额收益的预测表现,而只应聚焦拥挤度处于高位时的指标表现。此外,由于不同行业的股价表现有明显的差异化特征,我们针对每个行业筛选不同的指标。 各行业综合拥挤度指标表现稳健,择时效果优秀。我们对分指标滚动做0-1标准化后等权加总,以历史5年分位数值作为综合拥挤度指标。从统计结果上来看,综合拥挤度指标相对分指标平均实现了更为稳健的择时表现,且指标择时效果对参数设置不敏感,表现稳定。 综合拥挤度指标在单行业择时、行业横向比较及与景气度策略复合时均体现出了良好的效果。在用于单行业择时时,拥挤度指标实现了平均6%的年化超额收益;在用于行业横向比较时,高拥挤组合持续跑输基准;在与景气度策略复合时,相对纯景气度策略实现了4.4%的年化收益增强和更优秀的风险控制表现。 风险提示:本文结论基于历史数据统计得到,所构建指标未来存在失效风险。 1.引言 景气度与拥挤度是行业配置中绕不开的两个话题。从基本面视角看,景气度边际上行的行业往往具备更好的投资机会,但这也会吸引越来越多的投资者参与其中,致使行业估值泡沫不断膨胀。而当交易过于拥挤、微观交易结构恶化之后,即便行业景气度仍处高位,泡沫破裂的风险也在不断累积。2021年2月核心资产的股价崩塌就是最为生动的例证。因此,对行业拥挤度的度量、对高拥挤行业的规避,也是行业配置过程中极其重要的一环。 图12021年2月核心资产股价崩塌 本篇文章中,我们就重点探讨如何针对各个行业构建有效的拥挤度指标,实现对微观交易结构恶化风险的规避,主要分为拥挤度代理指标构造、有效指标筛选及综合指标构造三大部分,下面分别进行介绍。 图2本文逻辑结构 2.行业拥挤度的度量 想要做到对行业拥挤度的有效度量,首先就需要明确,何谓拥挤?我们认为,可以从行业整体、个股特征、资金流向三个角度对当下行业拥挤状态进行识别。 图3行业拥挤度度量方法 2.1.行业整体量价交易特征 从行业整体量价交易特征的角度出发,我们认为: (1)行业处于上行趋势中时,行业交易热度不断提升,表现为行业的成交额/市值在全市场中的占比迅速提升,收益率偏度明显上行,而当这一趋势达到历史极值水平时,则需要警惕交易拥挤带来的反转风险。 (2)在行业处于上行趋势中时,交易层面上往往表现为量价齐升,但在交易过于拥挤后,增量资金不足,量价开始出现背离,表现为量价相关性的显著降低。 (3)在上涨趋势末期,分歧加大,大涨大跌的现象更为常见,同时带来换手率/波动率/峰度的迅速抬升。 2.2.行业内个股交易特征 当行业刚开始受到市场关注时,增量资金驱动下行业内个股往往呈现普涨行情,而在交易趋于拥挤、增量资金不足时,板块内个股分化度显著提升,我们计算配对相关性指标来捕捉这一趋势。 𝑛 ∑ ∑ 𝑐𝑜𝑟𝑟(𝑟𝑛(𝑛 − 1) 𝑝𝑎𝑖𝑟_𝑐𝑜𝑟𝑟 = , 𝑟) 𝑖𝑗 𝑖=1𝑗≠𝑖 其中n为板块内股票数量,𝑟为个股i的收益率序列(我们同时也计算个股换手率、成交额的配对相关性)。当配对相关性较高时,表明个股同 𝑖 涨同跌,反之则表明收益分化。 值得注意的是,过往研究中对配对相关性指标的逻辑认知与本文相反:随着行业交易热度提升,市场的交易重心会从龙头股扩散至行业整体,即配对相关性越高,意味着交易越拥挤。但从实际行情走势上来看,板块趋势性上涨末期,往往对应的是板块内个股分化加剧。例如,2021年2月核心资产泡沫破裂时 ,白酒板块配对相关性处于历史低位 ,2020.2-2021.12,白酒板块相对净值走势与配对相关性之间的相关系数达到了-0.64。 图4白酒板块相对净值与配对相关性呈显著负相关 2.3.资金流向 资金的买卖行为中蕴含了大量可供挖掘的信息。当行业热度提升时,资金持续净流入,当这一趋势达到历史极值水平后,表明交易已经趋于拥挤,后续资金流入大概率趋缓甚至转为流出,难以支撑股价进一步上行。 基于此,我们构建买卖非均衡指标来反映资金流入强度: 𝐵− 𝑆𝐶= 𝑉 𝑖 𝑖 𝑖 其中,i表示第i类资金,包括机构/个人/所有投资者的主动交易/所有交易数据,𝐵表示第i类资金的买入金额,𝑆表示第i类资金的卖出金额,𝑉表示板块成交额。 𝑖 𝑖 2.4.拥挤度指标构造 上文中,我们对可以反映行业拥挤度的代理指标进行了初步梳理,而落实到具体的指标构建时,还需进行部分参数的设置。 参数选择上,我们并不刻意进行最优参数的搜寻,这会增加过拟合的概率。相对的,我们仅在常用参数中寻找最优解:对于换手率等无需时序数据进行计算的指标,我们选取较短的窗口期做移动平均处理,以增加其稳定性;对于量价相关性等需要历史序列进行计算的指标,我们则选取常用的20/40/60个交易日的移动窗口进行计算。 各类指标的参数设置如下表所示,其中,指标方向为正向是指指标值越大,代表行业拥挤度越高,负向则相反。 表1:指标参数设置 3.拥挤度指标筛选 通过拥挤度指标处于高位区间时未来一个月行业超额收益的均值和超额收益为负的胜率综合判断指标效果。我们认为,拥挤度这一概念主要用于规避交易过于拥挤带来的下跌风险,而低拥挤行业则不一定能够有超额收益。因此,我们不应衡量指标在全样本区间对行业未来超额收益的预测表现,而只应聚焦拥挤度处于高位时的指标表现。具体来说,对于各项指标,我们首先计算当期值在过去5年区间中的分位数水平,将指标转换为分位数序列,随后统计在分位数大于95%时,行业未来20个交易日超额收益的均值及超额收益为负的胜率,从而综合判断指标效果。 对于不同行业,由于行业特征不同,所选指标也应有所差异。我们认为,对所有行业采用同一套指标体系并不妥当。不同行业的股价表现有非常明显的差异化特征,例如食品饮料为长牛行业,而券商则容易短期暴涨暴跌,因此,能够有效反映不同行业拥挤度的指标也一定是不同的。 3.1.指标筛选流程——以食品饮料为例 根据以上考量,我们针对23个申万一级/二级行业,每个行业筛选表现最优的3个拥挤度代理指标,属于同一类别的指标仅择优取其一。其中,为防止样本量太小导致统计结果不可靠,我们要求入选指标历史上分位数大于95%的天数需大于20天,当多个指标的表现较为类似时,选取触发天数较多的指标。下面,我们以食品饮料行业为例,更清晰地展示我们的指标筛选流程。 下表中展示的是构建得到的各项指标在食品饮料行业中的择时表现。我们根据各项指标胜率排名和未来一个月平均超额收益排名之和(表中“排名”列)对各项指标的综合表现进行排序,选取触发天数大于20天且排名最靠前的三个指标。其中,由于排名第3的excess_ret_skew_40与excess_ret_skew_60为同一类指标,为避免指标信息过度重叠,我们向下选取pair_corr_ret_60作为入选指标。 表2:食品饮料行业各指标拥挤度择时表现(部分) 3.2.指标筛选结果 在上述筛选流程下,各行业最终入选指标如下表所示。可以发现,在判断行业拥挤度时,最为有效的指标类别为量价相关系数、配对相关性及买卖非均衡三类,平均每个行业中的入选指标里有2个来自上述三个类别。 表3:各行业入选指标 行业特征不同,入选指标特征也有明显不同,针对不同行业选取特质化指标确有必要。例如,对于行情启动时暴涨暴跌特征明显的券商行业来说,效果最好的是波动率、市值占比等交易特征指标;对于基础化工、医药生物等细分行业较多且逻辑不一的行业来说,配对相关性的效果就不佳。 4.综合拥挤度指标构建 上文中,我们已经完成对每个行业拥挤度指标组的筛选,下面,我们将其合成为综合指标,用于对行业拥挤度进行实时监测。 为了让不同行业间得到的拥挤度指标横向可比,我们滚动进行如下操作: (1)0-1标准化:在交易日T,我们对[0,T]区间内的分指标数据分别进行0-1标准化处理,将各项指标的取值范围转换到[0,1]区间内。 (2)等权加总:在行业拥挤特征非常明显时,通过不同维度信息构造的分指标应均会处于历史较高水平,而若分指标间差异较大,则表明当前行业拥挤现象并不是特别显著。因此,我们通过等权加总的方法将三个分指标合成为单一指标,以提高拥挤判断的稳定性。 (3)计算指标当期值在历史5年区间中的分位数水平。在完成上述两步操作后,我们还不能实现行业间指标的横向比较,例如,可能有些行业指标值最高为1,而有些最高为0.95。因此,我们再计算指标T期值在过去5年区间中的分位数水平,以该分位数水平作为该行业综合拥挤度指标的T期值。 (4)滚动进行(1)~(3)步操作,最终得到行业综合拥挤度指标序列。 基于上述指标构建流程,我们即可针对每个行业构建特有的综合拥挤度指标。下面,我们首先对综合拥挤度指标的整体择时效果进行统计分析,随后观察择时参数变化时,指标择时效果的变化,以考察指标的稳定性,最后以食品饮料行业为例,更直观地观察指标走势对行业下行风险的预判效力。 4.1.综合拥挤度指标择时效果统计 综合拥挤度指标在多数行业中均实现了与分指标相比更加稳健的表现。 与三项分指标的平均值相比,有70%的行业综合拥挤度指标实现了更高的胜率及更低的触发信号后未来一个月的超额收益,且大部分行业胜率均在70%以上,在反映行业拥挤度方面表现稳健。另外,多数行业的信号触发天数有所减少,表明综合指标在发出拥挤信号时更为谨慎,也因此提高了信号胜率。 表4:综合拥挤度指标择时效果统计 4.2.参数敏感性分析 前文的分析中,我们考察拥挤度指标处于历史五年区间95%分位以上时,行业未来一个月(20个交易日)的超额收益,但其中触发阈值95%及超额收益考察区间长度均为主观设定的参数,为检验指标稳定性,对这两个参数进行敏感性分析是有必要的。此处,我们对触发阈值处于[0.85,0.95]区间、时间区间长度处于[10, 60]区间时,行业超额收益及胜率表现进行统计。 触发阈值越高,平均胜率及负向超额收益也越高。首先,我们可以很明显地发现,触发阈值越高,平均来看负向超额收益及胜率均越高。这表明,随着阈值的上升,拥挤信号的准确度也在不断提高,这种单调性与拥挤度的内在逻辑一致,即拥挤度越高时,后续行业股价反转风险也会越高。因此,这一结果进一步证明了我们所构建的指标的有效性。 指标在阈值以上时,超额收益考察区间长度越长,平均来看负向超额收益越高,但结构上分化显著。从行业平均的角度来看,超额收益考察区间长度越长,平均负向超额收益越大,但平均胜率在考察未来30日超额收益时达到最大值。而从表现最差的行业的角度来看,区间长度大于30日时,指标择时效果最差的行业的超额收益及胜率表现就开始不断下滑。这表明,在区间长度过大时,指标的择时效果在不同行业中的分化有明显加剧,最优的区间长度为20-30日之间。 图5不同参数设置下平均超额收益 图6不同参数设置下超额收益平均胜率 图7不同参数设置下表现最差行业的平均超额收益 图8不同参数设置下表现最差行业的平均胜率 综合来看,我们构建得到的综合拥挤度指标对参数的敏感性较低,稳定性表现良好。而我们在前文中设定的参数虽然并不是全样本最优的参数组,但为了保持前后文的一致性,我们后面的分析仍以(0.95, 20)参数组为例,投资者在实际使用时可灵活选择相应参数。 4.3.综合拥挤度指标效果展示——以食品饮料为例 同样,我们以食品饮料行业为例,对综合拥挤度指标在实际行业拥挤风险规避中所起到