AI智能总结
基于基金持仓构建行业轮动策略流程。本文是继北向资金模型后,第二篇基于资金流的行业轮动模型。与我们此前研究的北向资金流模型不同,公募基金披露的个股持仓数据相当有限且有一定的时滞,因此基于基金持仓构建行业轮动策略需要进行一定的准备工作,具体包括以下四个流程:一是季报持仓还原,二是每月行业持仓计算,三是基金池筛选,四是因子计算。 “两步法”还原基金全部持仓。本章我们通过“两步法”来还原基金季报的全部持仓:第一步是通过上市公司十大股东还原基金的“真实持仓”;第二步利用基金行情、基金经理投资池、证监会行业限制等公开信息通过最优化方法还原基金“模拟持仓”。通过该方法能够较为准确地还原基金季报持仓,2009年以来持仓补全法的单个基金平均行业误差均值为1.26%,小于重仓股归一法的1.96%。 基金月度行业持仓比例计算。本章我们结合季报持仓还原结果,利用带约束的Lasso回归模型来计算基金的月度行业持仓,并将持仓法与回归法结合计算最终行业持仓比例。最终,基于持仓法与回归法结合的行业持仓比例计算结果准确性要略高于回归法,而及时性和数据样本量要高于持仓法。 基金池搭建。在本章,我们完成了宽基基金池、头部基金池、行业轮动优选基金池3个基金池的搭建,其中行业轮动优选基金池借鉴了Brinson模型的原理,以DifAR和DifRankIC两个指标来衡量基金的行业配置能力。截至21年底,宽基基金池、头部基金池、行业轮动优选基金池分别有2928、100、299只基金。 基金持仓因子计算及测试结果。基于基金行业持仓数据,我们从静态配置、动态增持、持仓分歧三个角度设计了10个基金持仓因子,并分别在3个基金池中进行计算,最终挑选5个因子参与复合策略合成。2012年以来,策略年化收益为16.71%,相对于基准指数(中信一级行业等权)年化超额收益达7.4%,超额收益最大回撤为23.41%,信息比率为0.67,月度胜率61.2%,月度调仓单边换手率为30.9%。 模型11月最新持仓为电子、机械、食品饮料、计算机、电力设备及新能源。 风险提示:量化模型基于历史数据构建,而历史规律存在失效风险。 1.基于基金持仓构建行业轮动策略的流程 1.1.行业配置研究框架 我们认为证券市场是一个复杂系统,受基本面、技术面、资金面和情绪面等多重因素共同影响,不同时期影响市场运行的主导因素不一定相同。 我们通过定量分析多维度建模,研究各行业板块的基本面、技术面、资金面和情绪面等多维度的边际变化。在行业配置研究系列前6篇专题报告中,我们借鉴股票多因子研究框架,完成了基于行业景气度、业绩超预期、分析师预期、北向资金和拥挤度共5个量化模型在行业配置中的应用。 图1:行业配置研究框架 在资金面系列的报告中,我们完成了基于北向资金的行业轮动模型,本文我们从市场中另一个重要机构—公募基金出发,试图通过追踪公募基金的持仓信息来构建行业轮动策略。 1.2.基于基金持仓构建行业轮动策略的流程 基于基金持仓构建行业轮动策略,需要重点考虑以下两个问题: 1.数据可得性问题。与北向资金每日公布个股持仓数据不同,公募基金仅在其定期报告中披露个股持仓信息,其中,半年报、年报披露全部持仓信息,但披露日较晚(分别为当年8月31日和次年3月31日),数据时效性较差;而季报在次月末可披露完毕,但仅披露前十大重仓股,数据完整性较低。因此,使用基金持仓构建行业轮动策略,首先需要利用全部可得的公开信息,尽可能准确地去还原公募基金在每月的行业持仓情况。 2.基金样本池问题。基于资金流的行业轮动模型,本质上是一种跟踪“聪明资金”的模型,即我们假定某些资金是足够聪明的,可以对我们的行业配置选择提供一些有益的建议。在北向资金模型中,由于资金来源不可拆分,我们只能将其视为一个整体作为追踪的对象。而在公募基金中,显然我们可以构建不同的基金组合作为“聪明资金”的代表。因此,如何构造一个具有行业配置能力、对选择行业有帮助的基金池是模型的第二个重点问题。 图2:基金定期报告披露时间及持仓 因此,从上述两个问题出发,基于基金持仓构建行业轮动策略主要包括以下4个步骤: 1.季报持仓还原。虽然年报和半年报可以提供完整准确的全部持仓信息,但其披露时间较晚,在3月31日、8月31日才可得到年报和半年报的信息,存在严重滞后。季报披露时间为报告期后15个交易日,即在次月末即可获取季报信息,包括基金的前十大持仓、持仓的证监会行业分布比例等。因此,我们可以充分利用季报信息,以基金十大重仓股为基础,通过证监会行业分布比例、上市公司十大流通股股东、基金经理同期和历史持仓信息等公开信息尽可能完整地将基金持仓补全,以弥补年报和半年报信息滞后的问题。 2.每月行业持仓计算。在经过季报持仓还原后,我们可以在1月末、4月末、7月末和10月末分别得到基金在12/31、3/31、6/30和9/30日四个时间点的全部持仓,但若只计算这4个时间点的基金行业配置比例用于行业轮动因子计算,仍存两个不足:一是会有15个交易日的时滞,二是全年只有4个数据点,行业轮动效率太慢。对此,我们可以通过已还原的基金持仓,结合基金净值数据,来模拟计算每个月末基金在行业上的持仓比例。 本文所说的基金行业持仓比例,均为基金持有行业市值占基金A股权益投资市值的比例,并非占基金净值的比例,下同。 3.基金池筛选。得到行业持仓比例的下一步为搭建跟踪基金池。在剔除掉行业主题基金、规模过小或过大、成立时间过短等不符合基本要求的基金后,我们可以根据规模、历史表现等特征去筛选出具有行业配置能力或跟踪价值的基金作为基金池,即“聪明基金”,作为我们跟踪的对象。 4.因子计算。上述三步做完后,我们可以利用基金行业持仓数据以及筛选好的基金池进行最终的基金持仓因子计算。 图3:策略主要步骤 下面我们将依次介绍上述四个步骤的具体做法。此外,本文所用的基金样本池为:wind基金分类中的开放式基金的偏股混合性基金、普通股票型基金和灵活配置型基金,并剔除掉定期开放式基金。 2.“两步法”还原基金全部持仓 我们采用“两步法”来还原基金全部持仓:第一步,还原基金的真实持仓,除了从基金季报中得到基金的十大重仓股外,我们还可以根据已披露的上市公司季报,获取上市公司十大股东/流通股东的数据,作为基金真实持仓的补充;第二步,还原基金的模拟持仓,首先建立一个基金经理可能投资的“股票池”,选股范围包括基金经理的历史持仓、同期其他基金的重仓股、调研记录、行业龙头股等,随后结合基金的行情数据,使用最优化的方法从“股票池”中筛选股票使得模拟组合的行情与基金行情尽可能吻合,最终获取基金的模拟持仓。真实持仓加模拟持仓即为基金最终的全部持仓,流程如下图: 图4:“两步法”持仓还原流程 2.1.获取基金的真实持仓 除了十大重仓股外,我们可根据在还原日之前发布的同期上市公司季报,获取到上市公司前十大股东/流通股股东的数据,若基金F的名字出现在公司A的前十大股东/流通股东名单里,且A不在F的十大重仓股名单中,则A也属于基金F的真实持仓,可以通过以下公式反推出F持有股票A的持仓比例: 𝑄 ⋅ 𝑃 𝐹𝑢𝑛𝑑𝐴𝑠𝑠𝑒𝑡 𝐻𝑜𝑙𝑑𝑅𝑎𝑡𝑖𝑜 = 其中,Q为基金持有该股的数量,P为股票在季报日的收盘价,FundAsset为基金的净资产。 2.2.获取基金的模拟持仓 在求解基金的模拟持仓过程中,我们认为一个原则是:重名单,轻比例。 即重视基金经理的历史持仓和同期持仓股票名单,因为这是基金经理最可能投资的股票标的,但不宜直接使用基金经理的历史持仓比例,因为基金经理存在调仓的可能性。对股票的持仓比例的计算,应该借助基金在季报日前后的净值变化的信息求得。求解模拟持仓的流程如下: 1.建立备选股票池。首先建立一个在季报日,基金经理最可能投资的股票池,依次在股票池中放入以下标的,并取交集: (1)基金真实持仓,包括十大重仓股及上市公司股东补充的股票; (2)基金经理历史及同期持仓,基金经理管理的同期不同基金的十大重仓股,以及其管理的近一年所有基金的基金持仓,同一基金存在多位基金经理的,分别纳入计算,下同; (3)基金经理调研记录,基金经理最近一年调研的所有股票; (4)中信行业龙头股,中信一级行业市值前10%的所有股票,若有中信行业筛选出的股票不足5只的,选该行业市值前5大股票; (5)证监会/GICS分类龙头股,选证监会行业和港股GICS行业分类市值前5大股票,目的是防止在最优化时出现某些证监会行业的股票数目为零。 2.最优化拟合持仓。我们利用上面生成的股票备选池构建基金模拟持仓组合,在个股和证监会行业的权重约束下,使组合收益接近季报发布日前后三个交易日的基金收益。最终,组合持仓和季报披露的证监会行业持仓占比、前十大重仓股及持仓比例、股票总仓位一致。假设股票备选池有n个股票,则写成优化模型如下: 𝑇 min ∑ 𝛼⋅ (𝜔⋅ 𝑆𝑅+ 𝜔∙ 𝐵𝑅+ 𝜔∙ 𝐶𝑅− 𝐹𝑅) 𝑡 𝑡 𝑏 𝑡 𝑐 𝑡 𝑡 𝜔 𝑡∈{−1,0,1} 𝑆. 𝑇. 𝑆𝐸𝐶 ∙ 𝜔=sec 𝑅𝐸𝐴𝐿 ∙ 𝜔 = 𝑟𝑒𝑎𝑙 𝑈𝑁𝑅𝐸𝐴𝐿 ∙ 𝜔 ≤ 𝑀𝐼𝑁(𝑓𝑢𝑛𝑑𝜔 ≥ 0 , 𝑐𝑜𝑚𝑝𝑎𝑛𝑦 ) 𝑡𝑜𝑝 𝑡𝑜𝑝 其中,𝜔 是模拟组合个股权重n维向量,𝛼 是第t天的权重系数,为 𝑡 SR是第t天个股收益率n维向量; 𝜔是基金持有纯债的比例,𝜔是基金持有转债的比例, t 𝑏 BR是第t天的债券收益率; CR是第 t t 𝑐 t天的转债收益率,FR是第t天的基金收益率。其余说明如下: t (1)我们取季报前后三个交易日作为基金收益率优化模型的目标(假设基金在此三天调仓较小或不调仓),t取-1/0/1三个值,其中t=0为季报日,若季报日不是交易日的,向前取最近一个交易日;t=-1和1分别为该日向前和向后一个交易日。考虑到季报日及季报日前基金调仓的可 能性会更大,因此引入一个权重系数𝛼 ,人为调低季报日及之前的权重: 𝑡 𝛼= 0.2{𝛼= 0.3𝛼= 0.4 𝑡 = −1𝑡 =0𝑡 =1 𝑡𝑡𝑡 (2)𝜔∙ 𝐵𝑅+ 𝜔∙ 𝐶𝑅是基金投资债券部分获得的收益率。其中债券投资分为纯债投资和转债投资,𝜔和𝜔分别为基金当季投资除转债外纯债和转债的比例,数据由基金季报获得; 𝑏 𝑡 𝑐 𝑡 𝑏 𝑐 BR为纯债收益率,用中债 t -综合财富指数(CBA00201)来计算,CR是转债收益率,采用中证转债指数(000832)计算。 t (3)约束①使得模拟组合的A股证监会行业和港股GICS行业的行业持仓比例与基金季报披露的一致。其中,SEC是一个k*n的矩阵,k为证监会行业加港股GICS行业数量,个股对应行业在矩阵SEC中的对应元素为1,否则为0,sec为季报披露的证监会行业和GICS行业持仓比例k维向量。 (4)约束②使得股票池中真实持仓的股票权重等于已知比例。真实持仓的股票数量是否大于10取决于能否从上市公司股东名单中获取到增量信息。REAL是n*n真实持仓矩阵,非对角线元素均为0,对角线上若第i只股票是基金的真实持仓,则矩阵元素(i,i)=1,否则为0。real是n维真实持仓比例向量,真实持仓个股的元素值为其对应权重,否则为0。 (5)约束③限制了股票持仓权重的上限。对于非真实持仓的股票,其权重比例的上限受2个条件同时限制,一是基金十大重仓股的最小持仓比例,二是对应上市公司十大股东中最小股东的持股市值占基金净值比例,若股票在基金中的权重比例大于前二者任意一个,则股票或基金会出现在重仓股或对应公司的股东名单中,因此,非真实持仓的股票权重要小于上述二者的最小者。UNREAL是n*n非真实持仓矩阵,非对角线元素