AI智能总结
行业配置研究框架。量化配置团队专注行业配置研究,致力于构建投资逻辑严密、研究深入细致、框架体系完备的多维行业轮动模型。之前的报告研究了景气度、业绩超预期、北向资金流、拥挤度等模型在行业配置中的应用。本篇报告基于分析师预测数据,使用更为全面细致的分析师预测因子构建行业轮动策略。 行业分析师预测因子计算方法。我们通过构建分析师预测因子刻画行业未来景气度的边际改善。使用加权法、简单整体法计算行业因子,主要测试的因子包括分析师覆盖度、分析师预测EPS变动及分位数、分析师预测净利润变动及分位数、分析师预测营收变动及分位数、分析师预测ROE变动及分位数等。 分析师预测单因子测试。通过单因子测试,根据超额收益信息比率筛选出9个因子用于等权合成复合因子:过去121天异常分析师覆盖(回归市值)、过去30天预测EPS-FY3环比6月变动的过去12月分位数、过去91天预测净利润-FY3环比6月变动(整体法)、过去30天预测ROE-FY3(加权法)的过去24月分位数等。 行业轮动策略历史回测较为优秀。回测发现:(1)复合因子分组测试:2010年1月至2022年9月,多头组年化收益为15.1%,相对基准年化超额为9.9%;空头组年化收益为-2.03%,相对基准年化超额为-7.23%;年化多空收益为17.13%。(2)行业轮动策略收益:2010年至2022年9月策略(前5行业)年化收益为16.65%,相对于基准(行业等权)年化收益5.20%,年化超额收益11.44%,超额收益最大回撤9.05%,信息比率1.4。换手率上,年度单边换手率均值为458%。(3)策略最新持仓:2022年9月策略持仓为:食品饮料、煤炭、电力设备及新能源、汽车、国防军工;截止9月9日,2022年策略收益为3.66%,超额收益12.60%。9月最看空的5个行业为:建材、非银行金融、钢铁、传媒、轻工制造。 风险提示 :量化模型基于历史数据构建,而历史规律存在失效风险。 我们国泰君安量化配置团队专注行业配置研究,致力于构建投资逻辑严密、研究深入细致、框架体系完备的多维行业轮动模型。在之前的行业轮动系列深度报告中,我们通过借鉴股票多因子研究框架,利用公司财务、分析师预测、北向资金、行情等数据研究了行业景气度、业绩超预期、北向资金流、拥挤度等模型在行业配置中的应用。本篇报告继续专注基本面维度,从分析师盈利预测数据出发,通过构建更为全面细致的分析师预测因子刻画行业未来景气度的边际改善,从而筛选出未来表现好的行业。我们详细测试了分析师预测因子在行业配置中的效果,最终使用投资逻辑强、历史回测效果好的因子构建分析师预测因子行业轮动策略。 1.行业配置研究框架 1.1.行业配置研究框架 我们认为证券市场是一个复杂系统,受基本面、技术面、资金面和情绪面等多重因素共同影响,不同时期影响市场运行的主导因素不一定相同,主要因素和次要因素在一定条件下可以相互转换。行业板块在基本面、技术面、资金面和情绪面等各维度可能出现共振,也存在相互约束的情形。我们通过定量分析多维度建模,研究各行业板块的基本面、技术面、资金面和情绪面等多维度的边际变化,优先配置行业景气度边际改善、机构资金持续净流入、市场微观结构健康、行业负面情绪较少的行业板块,并根据多维度边际变化动态调整组合行业配置。 图1:行业配置研究框架 1.2.行业多因子模型研究流程 我们参考股票多因子模型研究方法论,将市场上所有公司依据所属行业分类(中信一级行业分类)划分为不同行业类别的公司集合,将每个行业视为一家囊括所有同行业公司的集团公司,利用个股的财务、分析师预测、资金与量价等指标构造行业配置因子,探索有效的行业配置模型。行业多因子研究框架包括基础数据处理、行业因子合成、行业单因子测试、行业复合因子合成等步骤。行业多因子研究流程包括基础数据处理、行业因子合成(整体法、加权法)、单因子测试、复合因子合成等步骤,相关内容不再列示,参见行业配置系列研究报告《如何基于PEAD超预期因子构建行业轮动策略——行业配置研究系列02_20220426》。 图2:行业多因子模型研究流程 本报告基于分析师盈利预测数据,使用分析师因子构建行业轮动策略,通过测试行业单因子有效性,合成并研究分析师预测行业因子在行业配置中的效果。 2.分析师因子介绍 分析师盈利预测数据是重要的Alpha来源,是量化研究中不可缺少的数据源。结合之前研究经验,我们对比了行业内分析师预测数据提供商,全面评估了朝阳永续、Wind资讯等卖方分析师预测数据库情况。由于朝阳永续的历史数据收录更全、市场占有份额大、口碑更好,我们最终使用朝阳永续分析师预测数据计算分析师因子。 具体选用因子上,我们参考多因子选股中常用的分析师因子(表1),把它们应用到行业轮动研究中。我们使用朝阳永续盈利预测基础库的卖方预测数据中卖方预测数据表(rpt_forecast_stk)等计算行业的分析师预测因子。主要测试的分析师预测因子有:分析师覆盖度、分析师预测EPS变动及分位数、分析师预测净利润变动及分位数、分析师预测营收变动及分位数、分析师预测ROE变动及分位数、分析师预测ROA变动及分位数、分析师预测EP变动及分位数等,具体可见2.4测试因子列表。 表1:量化选股中常用的分析师因子 2.1.行业因子计算方法 计算分析师预测相关的行业因子,我们分别使用了加权法、简单整体法两种。加权法是先计算行业内成分股的相应因子,最后将通过自由流通市值加权的平均值作为行业因子。这种方式主要适用于公司分析师预测等数据。这类数据的特点是在个股上覆盖度不高、而且数据发布时间也不一致,时间上很难对齐,不太适合使用整体法。对于因子存在缺失的股票,使用行业中位数进行填充。采用加权方式的优点是,可以实现每天计算行业因子,保证了数据使用的及时性;缺点是牺牲了数据的一致性。我们在行业轮动报告《如何基于PEAD超预期因子构建行业轮动策略——行业配置研究系列02_20220426》中也是使用加权法。 简单整体法是把成分股的分析师预测数据(过去N日平均值)做加总得到行业的预测数据,并且只做成分股名单对齐、不做财报报告期的对齐。隐含假设是只用行业内有分析师覆盖的成分股汇总数据作为整个行业数据的代表。与整体法既要保证成分股对齐、又要保证财报报告期对齐的方式有所不同。整体法是基于行业自身或行业成分股财务基本面、微观结构技术面、资金流向等数据,合成行业层面用于行业因子计算的基础数据。比如,在行业轮动报告《如何使用业绩预告和业绩快报改进景气度行业轮动模型— —行业配置研究系列04_20220614》、《如何基于北向资金构建行业轮动策略——行业配置研究系列03_20220610》中,采用整体法合成所属行业整体数据,进而计算行业因子。采用整体法方式的优点是,统一在财报截止时点或者月底计算行业因子,保证了数据的一致性;缺点是牺牲了财务数据的及时性。 2.2.分析师因子超参数选择 计算分析师因子主要有3个超参数,分别是回看过去N天、环比M月,预测年份FY。以过去N日分析师预测ROE-FY的环比M月变动行业因子为例,有加权法、简单整体法两种计算方法,均涉及3个参数: 1)计算ROE分子端的预测净利润回看天数:过去30天、过去91天、过去181天。 2)环比变动的时间间隔:1个月(环比)、3个月(季度)、6个月(半年度)、12个月(去年同比)。这个参数主要是计算环比变动因子使用。 3)净利润的预测年度:FY1、FY2、FY3。 我们会对比3*4*3=36种参数组合下分析师预测行业ROE变动因子的绩效,分析不同参数下表现,重点选择对参数不敏感(在尽可能多的参数组合上整体效果好)的因子用于行业轮动策略构建。 此外,对于历史分位数因子,还涉及到时间序列上回看过去F个月,F选择12、24两个参数值。比如过去30天预测净利率-FY3的过去12月分位数因子。 2.3.因子计算示例 我们以过去90日分析师预测行业ROE-FY1环比1月变动因子为例,说明简单整体法和加权法的计算过程。对于该因子,超参数分别为过去天数N=90、环比月份M=1、预测年度为FY1。两种方法计算过程如下: 简单整体法。首先,计算行业h内股票i的过去90日分析师预测净利润平均值,得到𝑓𝑜𝑟𝑒𝑐𝑎𝑠𝑡_𝐹𝑌1_90𝑑𝑎𝑦。然后,计算行业h的过去90日分析师预测行业ROE-FY1为: 𝑛𝑝 𝑖 ℎ𝑖=1 ∑ 𝑓𝑜𝑟𝑒𝑐𝑎𝑠𝑡_𝐹𝑌1_90𝑑𝑎𝑦 𝑡𝑜𝑡_𝑠ℎ𝑟ℎ𝑙𝑑𝑟_𝑒𝑞𝑦_𝑒𝑥𝑐𝑙_𝑚𝑖𝑛_𝑖𝑛𝑡 𝑛𝑝 𝑖 𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦= ℎ ℎ𝑖=1 ∑ 𝑖 过去90日分析师预测行业ROE-FY1环比1月变动因子的计算公式为: 𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦_hb1𝑚=𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦−1月前𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦 ℎ ℎ ℎ 加权法。过去90日分析师预测行业ROE-FY1环比1月变动因子是过去90日分析师预测行业内个股ROE-FY1环比1月变动的加权平均值,使用自由流通市值权重加权。 ℎ𝑖 ∑ 𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦_hb1𝑚= 𝑐𝑜𝑛_𝑅𝑂𝐸_𝐹𝑌1_90𝑑𝑎𝑦_hb1𝑚∗𝑤 ℎ 𝑖 𝑖𝑖𝑛ℎ 2.4.测试因子列表 考虑不同类别的分析师因子和多种超参数组合,本报告主要测试的分析师预测因子见下表: 表2: 分析师预测因子列表 3.单因子测试结果 我们采用因子IC、分组测试对行业因子进行单因子测试。在每月底进行分组调仓操作;根据因子的投资逻辑,每月底按因子值从小到大排序分5组,分别为t0、t1、t2、t3、t4,一般因子最小的t0组为空头组,因子最大的t4组为多头组。回测日期区间为2010年1月至2022年9月。基准指数采用中信一级行业指数等权合成。 我们下面依次对各个分析师因子的单因子测试结果进行展示。我们经验性的将多头组年化超额收益5%以上、超额信息比率0.7以上、年化多空收益10%以上作为效果较好因子的评价标准。在评价因子效果,主要统计在不同参数组合上多头组年化超额收益表现,信息比率和年化多空收益的结论基本一致。 3.1.分析师覆盖度(总体效果较好) 分析师覆盖(Analyst Coverage)因子的投资逻辑指过去一段时间分析师撰写报告数量越多的公司,未来表现越好。一般认为分析师只覆盖和推荐自己看好的公司,对于不看好的一般不会写报告看空。我们使用过去N日(60、90、120、180)报告数量的对数作为个股的分析师覆盖度因子,然后自由流通市值加权得到行业因子。 除了使用报告数原始值,还有可以考虑剥离股票市值SIZE、换手率TO、动量MOMEN等因素的计算股票的异常分析师覆盖。常用的做法是回归后取残差作为异常覆盖度因子: 𝐿𝑜𝑔(1+𝑇𝑂𝑇)=𝛽+𝛽𝑙𝑜𝑔𝑆𝐼𝑍𝐸 +𝛽𝑇𝑂 +𝛽𝑀𝑂𝑀𝐸𝑁 +𝜀 𝑖,𝑚 𝑖,𝑚 𝑖,𝑚 𝑖,𝑚 𝑖,𝑚 我们先计算行业成分股的分析师覆盖度、异常覆盖度因子,然后进行自由流通市值加权,得到行业因子。对分析师覆盖度行业因子进行单因子测试,从下表可以看出,剥离掉市值因素影响后的异常覆盖度的效果整体明显优于原始覆盖度,也优于剥离股票市值、换手率、动量等因素的异常覆盖度因子。相比原始覆盖度年化超额收益2%-3%,异常覆盖度(回归市值)的年化超额收益提高至5-6%,多空收益提高至7%-10%。效果最好的是120日报告数量的对数(回归市值),年化超额收益达6.71%,信息比率1.06。具体绩效指标见下表。 表3: 分析师覆盖度因子(加权法)主要绩效指标 年化超额较高因子的分组累计