您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:行业配置研究系列03:如何基于北向资金构建行业轮动策略 - 发现报告

行业配置研究系列03:如何基于北向资金构建行业轮动策略

2022-06-10 张雪杰,刘凯至,余齐文,廖静池 国泰君安证券 北京律师
报告封面

行业多因子研究流程。借鉴股票多因子模型框架,利用北向资金持仓数据合成北向资金流因子,通过单因子测试合成并研究北向资金流因子在行业配置中的应用。行业多因子研究框架包括:基础数据处理、行业因子合成、单因子测试、复合因子合成等步骤。 北向资金流因子计算方法。参考业内投资经验,构建4大类北向资金流因子,分别为静态持仓因子、动态流入因子、流入增速因子、交易活跃度因子,并将陆股通结算机构持股数据引入,将北向资金流因子由单一维度拓展至北向资金整体、银行类资金、券商类资金维度。 北向资金流因子测试。通过因子IC测试与分组测试,结合资金流的短、中、长周期,筛选出3类6个因子参与复合因子合成:动态流入类(北向资金60日净流入占市值比、北向资金120日正向净流入占市值比);流入增速类(北向资金月净流入占市值比环比增速、券商资金10日净流入占市值比环比增速);交易活跃度因子(北向资金月度正向交易活跃度、北向资金5日正向交易活跃度)。 北向资金流复合因子分组测试效果不错。历史回测发现,2017年1月至2022年5月,多头组累计收益为146.5%,年化收益为18.91%,相对基准年化超额收益为17.04%;空头组累计收益为-19.62%,年化收益为-4.1%;复合因子年化多空收益为24%。 行业轮动策略超额收益较为优秀。2017年1月至2022年5月,策略组合(选前5行业)年化收益为17.58%,相对于基准指数(中信行业等权)年化超额收益达15.73%,超额收益最大回撤9.55%,信息比率1.89。换手率方面,年度单边换手率均值为617%。 北向资金流因子行业轮动策略最新持仓。2022年6月策略组合为:有色金属、基础化工、消费者服务、银行、交通运输。截止6月9日,2022年以来北向资金流复合因子行业轮动策略收益为-9.01%,相对基准的超额收益为5.35%。 风险提示:量化模型基于历史数据构建,而历史规律存在失效风险。 1.行业多因子模型研究流程 我们参考股票多因子模型研究方法论,将市场上所有公司依据所属行业分类(中信一级行业分类)划分为不同行业类别的公司集合,将每个行业视为一家囊括所有同行业公司的集团公司,利用个股的财务、分析师预测、资金与量价等指标构造行业配置因子,探索有效的行业配置模型。 行业多因子研究框架包括基础数据处理、行业因子合成、行业单因子测试、行业复合因子合成等步骤。 本报告使用基于北向资金持股数据合成北向资金流因子构建行业轮动策略,通过测试行业因子有效性,合成并研究北向资金流因子在行业配置中的效果。 图1:行业多因子模型研究流程 1.1.基础数据处理 由行业内个股数据计算行业因子,一般有两种方式。一种是整体法,基于行业自身或行业成分股财务基本面、微观结构技术面、资金流向等数据,合成行业层面用于行业因子计算的基础数据。比如,在行业轮动第一篇报告《如何基于景气度构建行业轮动策略》中,我们基于公司资产负债表、利润表、现金流量表采用整体法合成所属行业整体的财务基本面数据。 对于采用整体法的基础数据处理需注意: 1)用于行业数据合成的成分股数据时点需保持一致,当成分股最新数据所属报告期不一致时需有统一合理的数据对齐规则(如以财报数量、公司市值占比较大,数据较新者为准); 2)行业基本面数据需有经济含义,对于某些行业不适用的数据需特殊处理(比如用行业均值或中位数填充); 3)缺失数据处理应以合理性为处理原则。 采用整体法方式的优点是,统一在财报截止时点或者月底计算行业因子,保证了数据的一致性;缺点是牺牲了数据的及时性。 另一种方式是加权法,直接使用行业内个股因子加权合成行业因子。这类数据的特点是在个股上覆盖度不高、而且数据发布时间也不一致,时间上很难对齐,不太适合使用整体法。对于这类数据,基础的数据处理工作主要是先计算个股因子,方便之后采用行业内成分股因子加权(比如自由流通市值加权等)合成所属行业的因子。比如,在行业轮动第二篇报告《如何基于PEAD超预期因子构建行业轮动策略》中,我们基于公司超预期数据、分析师一致预期等数据采用加权法合成所属行业整体的超预期数据。 采用加权方式的优点是,可以实现每天计算行业因子,保证了数据使用的及时性;缺点是牺牲了数据的一致性。 1.2.行业因子计算 对于整体法,我们基于基础数据处理后的行业数据,计算可用于行业比较的行业因子数据。比如,通过不同报告期行业整体的收入与利润数据,计算行业整体的收入与利润增长率因子。计算行业因子计算需注意:1.行业因子在不同行业间需具有可比性; 2.行业因子需要考虑行业数据季节性变化规律,对于存在季节性变化的数据采用单季或完整年度数据同比计算; 3.行业不同时期前后比较时,应保证用于行业合成的公司前后一致以保证可比性。 对于加权法,计算行业因子计算需注意: 1.计算得到每只股票的因子后,行业因子使用行业内成分股自由流通市值加权计算。测算发现,市值加权优于等权。 2.当某只股票某个因子缺失时,考虑使用该行业的中值或均值替代。 3.不对个股因子进行市值行业中性化处理。市值行业中性化处理仅适用于选股,不适用选行业。 1.3.单因子测试 我们通过单因子IC测试与分组回测来考察行业单因子收益预测的有效性与稳定性。 1.因子IC测试 我们计算T期因子值与T+1期行业收益率的Pearson相关系数(RawIC),同时计算因子T期因子值排序与T+1期行业收益率的Spearman相关系数(RankIC)。因子的IC值是指第T期的因子值(因子中性化处理后残差)x⃗与T+1期的股票收益r的相关系数——Pearson相关系数,公式表示为: t t+1 𝐼𝐶= 𝑐𝑜𝑟𝑟(𝑥, 𝑟 ) 𝑡 𝑡𝑡+1 此外,可以计算秩相关系数——Spearman相关系数,使用两个变量的位次计算,是与因子分布无关的,公式表示为: ),𝑟𝑎𝑛𝑘(𝑟 )) 𝐼𝐶 = 𝑐𝑜𝑟𝑟(𝑟𝑎𝑛𝑘(𝑥 𝑟𝑎𝑛𝑘,𝑡 𝑡 𝑡+1 可以通过以下指标评价因子效果: a)b)c)d) IC值的均值——因子显著性; ICIR比率(IC均值/标准差)——因子有效性; IC序列T值(IC均值*sqrt(样本数-1)/IC标准差)——因子显著性; IC值的胜率(IC值大于0的截面数占比)。 2.因子分组测试 因子分组测试是根据因子值打分排序分多组测试各组组合累计净值表现,我们采用5组定期调仓的方法进行测试(每组含6个中信一级行业)。 因子多空测试是分组测试中第一组与第五组多空强弱表现,多空测试与分组测试可以一并进行。 我们可以从多个维度考察分组测试效果:a) 分组测试结果是否具备单调性,即各分组累计净值表现与其排序是否具有一致性,分组测试结果单调性越高越好; b) 分组多空收益表现,即考察第一组和第五组累计净值相对强弱表现及其最大回撤; c) 多头组合相对市场基准表现,即考察第一组与市场基准指数相对强弱及其最大回撤。 因子分组测试主要考察以下绩效指标:a) 分组测试的累计收益率、最大回撤等; b)c) 多头组合的年化收益率、年化波动率、夏普比率、最大回撤等; 多头组合相对市场基准的超额年化收益率、超额年化波动率、信息比率、超额最大回撤等。 因子分组测试采用定期调仓的方式进行回测。在本篇报告中基于北向资金因子按整体法得到行业因子,考虑到港股通公布持仓数据是在第二天,我们在每月初进行组合调仓操作。采用中信一级行业指数合成市场基准指数,基准指数组合与分组测试同步调整持仓。 1.4.复合因子合成 基于单因子测试结果,我们筛选此类因子中单因子IC测试与分组测试表现较好的因子作为备选因子,经由因子IC值相关性分析选出相关性较弱、收益率较高且具有经济学含义的因子合成行业复合因子。 我们采用单因子等权相加的方法合成复合因子,即将候选单因子通过去极值、标准化等方式进行预处理,然后通过等权相加的方式合成行业复合因子。 复合因子的测试方法与单因子测试相同,可以通过因子IC测试与分组回测测试复合因子收益预测的有效性与稳定性。复合因子测试时需关注多头组合的年化收益率、夏普比率、最大回撤,以及多头组合相对市场基准的年化超额收益率、信息比率和超额最大回撤。 2.北向资金因子介绍及计算方法 2.1.资金流因子介绍 我们希望通过景气度、超预期、资金流、微观结构、市场情绪、拥挤度等多个方面构造自己的行业轮动模型。在此前两篇行业轮动报告中我们分别基于公司财务、分析师预期等数据构建了行业景气度因子和超预期因子,本篇报告是我们团队行业轮动系列报告的第三篇,将引入资金流因子,完善整体行业配置体系。 资金流是行业配置中较为重要的一环,其逻辑独立于基本面因子,可以作为后者的重要补充。我们认为资金流能带来阿尔法超额收益的原因主要有三:一是资金买入卖出本身就是股市涨跌的驱动力,只有资金持续流入才能推动股价不断上涨;二是北向资金、公募基金等大机构往往掌握了更多的信息,符合我们一般意义上“聪明钱”的定义,跟踪此类资金流向有助于我们发掘更多领先的有益信息;三是北向、公募持仓、大单等公开信息被市场广泛关注,具有一定引领投资的作用。 基于市场公开信息,资金流因子根据投资主体不同可以分为北向资金、公募基金、杠杆资金(两融)、被动资金(ETF)、产业资金(回购、增减持)等;根据订单簿信息可以分为大单、中单、小单等。本篇报告以市场关注度最高的北向资金作为我们整个资金流因子研究的起点,后续报告将陆续加入公募基金、杠杆资金等其他细分因子,以构建完整的行业资金流跟踪体系。 2.2.北向资金因子介绍 自从2014年沪股通、2016年深股通先后开通以来,北向资金逐渐成为境外资金配置A股的主要力量,持股占比、交易占比不断提升,对A股的话语权也不断增强。2017年后港交所开始披露陆股通个股持股数据,数据的公开给了投资者在北向资金选股、择时、行业配置等方面进行研究的机会。经过跟踪后市场发现,北向资金在A股行业选择、选股、择时方面均具有较强的能力,北向重仓的个股往往表现较为抢眼,因此对于北向资金因子的研究开始逐渐出现。 由于我们是根据陆股通数据来计算行业因子,因而我们需要知道纳入陆股通的标的股票在各行业中的代表性如何,即首先需测算陆股通标的股在各行业的覆盖程度。截至2022年4月30日,陆股通标的在30个中信一级行中有27个行业的覆盖程度超过50%,仅商贸零售、综合和纺织服装低于50%,分别为47%、45%和41%。因此我们认为陆股通标的股对于各行业覆盖程度较高,是有足够代表性的。 图2:陆股通标的股各行业流通市值占比 根据实际投资经验,本文我们将北向资金因子分为4个大类:一是静态持仓因子,此类因子主要关注北向资金的静态持仓偏好,如持仓市值、持仓占比、相对超配比例等;二是动态流入因子,此类因子关注北向资金动态变化情况,如资金净流入情况、持股比例变动情况等;三是净流入增速因子,考察北向资金净流入的增速;四是交易活跃度因子,此类因子关注北向资金在各行业上的交易活跃情况,一般以北向资金成交金额除以行业总成交金额计算。而根据结算机构的不同,又可以将北向资金分为银行结算、券商结算等。下面我们将详细介绍北向资金因子的构建流程。 2.3.北向资金个股净流入计算方法 首先我们介绍北向资金个股净流入的计算方法。对于陆股通,港交所主要披露两个数据,一是北向资金每天沪深两市各自整体净流入金额,另一个是每天个股的持股数量,我们需要自己计算每日个股的净流入量,进而合成行业净流入数据。本文使用(当日持股-前一日持股)×当日平均成交价格来计算北向资金在个股上的每日净流入: ) ∗ 𝑉𝑤𝑎𝑝 𝐼𝑛𝐹𝑙𝑜𝑤= (𝐻𝑜𝑙𝑑− 𝐻𝑜𝑙𝑑 (2.1) 𝑡 𝑡 𝑡 −1 𝑡 其中,平均成交价格=当日成交金额/成交股数。 在计算个股日净流入时,有一个问题需要考虑,即A股的复权问题,A股的