金融工程 证券研究报告 专题报告2024年04月24日 【专题报告】 偏股基金持仓穿透及其交易行为研究 华创证券研究所 证券分析师:王小川 电话:021-20572528 邮箱:wangxiaochuan@hcyjs.com执业编号:S0360517100001 联系人:黄河 邮箱:huanghe@hcyjs.com 相关研究报告 《AI+HI系列(4):CrossGRU:基于交叉注意力的时序+截面端到端模型》 2024-04-19 《短期信号大多中性,市场或仍处于筑底过程— —2024年一季度策略总结与未来行情预判》 2024-04-08 《并行计算在金融上的应用》 2024-03-22 《排序学习选股模型之沪深300精选》 2024-03-21 《AI+HI系列(3):人工智能在选股与ETF轮动上应用》 2024-03-15 方法概述——逐步更新二次规划 我们对比了测算偏股基金个股仓位的两种算法,算法一是通过披露信息对季报补全、对年报增加调仓惩罚来进行穿透持仓,方法二是使用基金目前已知最新信息,通过重仓股和行业指数共同对基金持仓进行穿透,通过行业指数映射回个股持仓。 研究结果表明,回看天数和惩罚系数共同决定了算法穿透的准确性。算法一和算法二的精确度类似,但是算法二的鲁棒性更好。 偏股基金调仓行为和沪深300指数变化情况——偏股基金像是市场的跟随者通过研究基金的高频仓位和沪深300指数的关系,我们发现偏股基金的仓位和沪深300指数走势存在相关性。从统计来看,偏股基金的调仓滞后于沪深300指数变化2到3周。这表明,偏股基金的交易行为像市场趋势的跟随者,而不具备显著的预见性。 偏股基金调仓行为与市场成长价值风格变化相关性较高 通过研究基金的风格加权仓位和成长价值与大盘小盘指数的相关性,我们获得以下结论: 偏股基金仓位的变化和成长价值指数同步性较高。这从侧面表明偏股基金或是市场成长价值风格变化的主要参与者。偏股基金的成长价值风格变化受到内生的自我促进和外生的宏观经济情况共同作用。 从偏股基金仓位和大盘小盘指数的关系来看,偏股基金对大盘小盘风格切换反应相对较慢。 投资建议: 测算偏股基金持仓可以把握偏股基金当前对市场的偏好。 风险提示: 算法对偏股基金仓位的测算存在滞后性;本报告中所有统计结果和模型方法均基于历史数据。 投资主题 报告亮点 提出一个新的测算偏股基金仓位的方法。该方法兼顾了准确性和鲁棒性。高频持仓分析。分析了偏股基金仓位和沪深300指数走势和市场风格的关系。 结果表明,偏股基金的调仓行为滞后于沪深300指数走势,偏股基金的风格在成长和价值的切换快于在大盘小盘风格的切换。 投资逻辑 测算偏股基金仓位有助于把握偏股基金的偏好。 目录 一、方法概述5 (一)算法一5 1、3月末和9月末的持仓穿透5 2、6月末和12月末的持仓穿透6 3、参数影响与结果分析7 (二)算法二11 1、季报处理(3月末、6月末、9月末、12月末)11 2、参数影响与结果分析12 (三)算法一和算法二对比15 1、穿透精度15 2、鲁棒性16 二、周频下的基金行为范式研究17 (一)调仓行为18 (二)选股风格行为19 三、风险提示23 图表目录 图表1算法一测算流程7 图表2算法一平均相对误差(单位:%)8 图表3算法一平均绝对误差(单位:%)8 图表4算法一制造业平均相对误差(单位:%)9 图表5算法一制造业平均绝对误差(单位:%)9 图表6算法一金融业平均相对误差(单位:%)9 图表7算法一金融业平均绝对误差(单位:%)9 图表8算法一仓位相对误差误差条图10 图表9算法一仓位绝对误差误差条图10 图表10行业与算法中所用的替代指数11 图表11算法二平均相对误差(单位:%)12 图表12算法二平均绝对误差(单位:%)12 图表13算法二制造业相对误差图(单位:%)13 图表14算法二制造业绝对误差图(单位:%)13 图表15算法二金融业相对误差图(单位:%)13 图表16算法二金融业绝对误差图(单位:%)13 图表17算法二仓位相对误差误差条图14 图表18算法二仓位绝对误差误差条图14 图表19算法一误差分布图15 图表20算法二误差分布图15 图表21某基金的仓位估算17 图表22偏股基金仓位和沪深300走势图18 图表23沪深300与偏股基金的领先滞后关系19 图表24代码和名称19 图表25成长价值加权分位数和成长价值溢价关系20 图表26大盘小盘加权分位数和大盘小盘溢价关系21 图表27风格与偏股基金的领先滞后关系21 一、方法概述 基金持仓穿透是指利用基金已经披露的信息来测算基金的全部持仓情况。根据《公开募集证券投资基金信息披露管理办法》,基金管理人应在每年结束之日起三个月内编制完成基金年度报告,应在上半年结束之日起两个月内编制完成基金中期报告,应在季度结束之日起十五个工作日内编制完成基金季度报告。在季度报告中,基金会公布资产组合情况,按行业分类的股票投资组合以及按公允价值占基金资产净值比例大小排序的前十名股票投资明细。而在半年报和年度报告中,基金会披露全部持仓情况。 从方法论上看,有两类主要方法:第一类是利用卡尔曼滤波,第二类是利用约束优化(二次规划)求解。由于卡尔曼滤波方法需要考虑变量之间的相关性,而当基金持仓中的股票数量较大时,获取一个稳定的协方差矩阵并不容易。因此,本文主要采用约束优化的方式来解决问题。 约束优化求解将问题转化为在一定约束条件下求解基金的持仓权重,其目标是使基金的表现与求解后的组合表现一致。 之前的研究已经使用二次规划对基金的持仓进行穿透,但在我们的复现过程中发现,严格按照基金的披露信息进行求解可能导致许多基金无法通过二次规划获得结果。这种情况的原因包括:基金可能持有新股,而基金披露的行业分类与股票实际所属行业不一致。在本文的测试中,即使放宽了部分约束,仍然存在无法拟合的情况。 在本文的新算法中,我们的方法是按照基金披露的信息,将基金的行业权重映射到相应的行业指数,并结合该基金披露的重仓股,构建初始股票池及其权重。然后,通过对该组合的权重施加调仓惩罚,来拟合基金的持仓比例。最后,将行业指数按照其个股构成比例映射回基金的持仓,从而获得基金的个股仓位情况。 在本文的第一章,我们首先比较了两种方法的优劣,并给出了不同参数对结果的影响。 本文所用的测试样本为成立于2016年1月1日前至2024年4月1日依然运行的偏股混 合型基金,样本池内共计有385个样本。为了避免新成立基金存在建仓期,算法从2017 年1月1日开始计算。 本文对持仓穿透方法的准确度评价标准是所求解的基金持仓与基金定期披露的总仓位和部分行业仓位分布的一致性。一些研究者将求解结果与偏股基金指数的偏离程度作为衡量指标,然而,我们发现,偏股基金指数的成分股经常发生较大变化,这使得该评价标准在时间序列上不具有一致性。由于基金的仓位信息和行业仓位信息只在季报、半年报和年报中披露,因此在第一章进行方法比较时,本文仅考虑了这四个时间节点上真实仓位和算法测算仓位之间的误差情况。 (一)算法一 1、3月末和9月末的持仓穿透 在每年的3月末和9月末,可以获取到基金的年报和半年报持仓。在这两个时间节点,可以回顾过去一段时间基金的净值变化情况,并利用基金年报披露的持仓信息,通过对持仓进行调仓惩罚,进行持仓穿透分析。模型假设,在回看期这段时间内,个股的仓位不发生变化。 公式如下, ��2 𝑚𝑖�∑(∑𝑤𝑖𝑟𝑖,�−𝑓�)+𝜆|𝒘�−𝒘|(1−1) 𝑡=1𝑖=1 0<𝑤�≤0.1(1−2) � 0.6≤∑𝑤�≤0.95(1−3) 𝑖=1 公式1-1为目标函数,公式1-1中,N为回看天数,𝑤�为个股权重,𝑤�为基准权重,对应 年报或半年报披露的持仓,𝑓�为基金的净值变动,�为惩罚权重,公式1-2和1-3分别对个股的持仓仓位和总仓位做出限制。 𝑡=1 如果考虑到期日越近对日期增加权重,公式1-1可以改为𝑚𝑖�∑� � (∑ 𝑖=1 𝑤�(𝑤𝑖𝑟𝑖,�− 2 𝑓𝑡))+𝜆|𝒘�−𝒘|,𝑤�为时间权重,在我们的测试中,使用了指数衰减,但由于回看时间 段不会很长,这使得过大的权重衰减会使得近期权重过大而失真,过小的权重又会导致其与等权无差异。因此在本文后续的研究中,不考虑时间加权。 这里,由于偏股基金持仓中包括现金和债券,为了简便计算,债券的收益率采用中债-新综合指数替代,其处理方式与股票类似。 2、6月末和12月末的持仓穿透 对于6月和12月末的季节持仓情况,需要通过季报补全的方式获得公式1-1中的𝑤�基准权重。 在每年的6月末和12月,可以获取到Q1和Q3的季报。在季报中,基金会披露行业持仓、总仓位以及前10大重仓股。备选股票池应该包括该基金上一期的半年报或年报所披露的持仓股票,以及已知上市公司财报所披露的流通股东。此外,考虑到部分基金可能会频繁调仓,备选股票池还应该包括回顾期内每个行业市值最大的股票,以提升二次规划方程的可求解性。 目标函数为: 30�2 𝑚𝑖�∑(∑𝑤𝑖𝑟𝑖,�−𝑓𝑡) (1−4) 𝑡=1𝑖=1 约束为: � 𝑤�=𝑤𝑟,�=1,2,…,10(1−5) 目的为固定前10大股票的持仓比例。 0<𝑤�<𝑤10,�>10(1−6) 目的为剩余股票的持仓占比小于第十个重仓股的占比。 𝑯�=𝒘ind(1−7) 目的是披露的行业应该满足季报披露的行业占比。 � ∑𝑤�=𝑤�(1−8) 𝑖=1 目的是披露的总仓位应该满足季报披露的总仓位。 公式1-7中,如果严格按照季报披露的情况,对股票的行业持仓进行约束,会导致较多基金无法通过二次规划求解,因此,公式1-7的约束放松为1-9: 𝑯�≤𝒘ind+2 𝑯�≥𝒘ind−2 (1−9) 即允许基金在行业持仓权重有上下2%的浮动。即使在该条件放松的情况下,也存在部分基金无法求解得到权重的情况。常见的情况主要有,基金错误披露持仓所属行业,基金持仓有停牌股票等。 通过上述方法对基金进行一季报和三季报补全,季报补全后的基金持仓情况再通过公式 1-1,1-2,1-3所述的方法求解持仓权重。示意如下: 图表1算法一测算流程 资料来源:华创证券 3、参数影响与结果分析 在上述计算中,当基准权重确定后,影响持仓穿透准确度的因素包括回看天数和惩罚权重。一方面,如果回看天数过短,结果可能不可靠;反之,如果回看天数过长,则会导致求解的权重具有严重的滞后性。另一方面,惩罚权重过大可能导致对基准权重的调节不足,使得权重趋于保持基准不变;而惩罚权重过小则相当于忽视了已披露的持仓信息,使得权重可以自由变动。 这里,我们定义仓位误差为: 𝑒�=𝑤�−𝑤�(1−10) ��� 其中𝑤�是算法计算得到的基金仓位,𝑤�是基金披露的真实仓位。 �� 定义绝对仓位误差为: |𝑒𝑖|=|𝑤�−𝑤𝑖|(1−11) ��� 其中公式1-10,表征了算法的相对误差,公式1-11,表征了算法的绝对误差。 我们统计了样本空间内的所有基金的平均相对误差和平均绝对误差: 𝑒̅�=̅𝑤̅̅𝑖̅̅−̅̅̅𝑤̅̅̅� (1−12) ��� |̅̅𝑒̅𝑖̅̅|=̅|𝑤̅̅̅𝑖̅̅−̅̅𝑤̅̅̅𝑖̅| (1−13) ��� 其中,我们也分别针对制造业和金融业进行了统计。 不以个股仓位和所有行业进行统计的原因有两点。首先,基金的详细个股持仓信息通常只在年报和半年报中披露,因此可供统计的数据量较少。其次,按照个股和行业进行统计可能会因为部分股票和行业的基金持仓量较少,导致对整体误差产生平均效应,即较大的误差会被较多的样本平滑,这样就无法真实反映出算法的潜在缺陷。 从总体持仓来看: 图表2算法一平均相对误差(单位:%)图表3算法一平均绝对误差(单位:%) 资料来源:Wind,华创证