您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国联证券]:机构主动资金流:股票多因子系列1 - 发现报告

机构主动资金流:股票多因子系列1

2022-07-19 朱人木 国联证券 球球
报告封面

报告要点: A股行情数据 A股市场成立近30年来,全市场股票数量不断增加,日成交额此起彼伏。 以中证全指(000985.SH)为例,在2015年大牛市时,日成交额一度出现历史高值2万亿以上,之后成交额急剧下降,直到2019年初开始震荡式回升。疫情后,市场资金宽松,再次出现连续多个交易日全市场日成交额达到1万亿规模以上的情况。 逐笔数据追踪机构主动资金 通过逐笔数据刻画机构主动资金,构建一个机构主动资金因子ABSR,构建一个常见的量价因子RETAMT。对不同视角的两个因子逐个进行了因子评测、单因子各参数数值组合、两因子的逻辑组合。两因子的long-short有明显正向的收益,横截面分组的收益也比较线性。 因子组合回测 对组合后的因子,分别在中证全指、沪深300、中证500和中证1000股票池里进行回测。在中证全指上的收益增强表现较好,总超额收益为 206.26%,超额年化收益率为9.16%,信息比率为0.84,持股数量也随着中证全指成分股的增加而相应增加。从2020年以来,持股数量在1100-1400只之间,策略容量上限大。 组合因子Barra归因分析 在中证全指、沪深300、中证500和中证1000不同股票池里面,行业因子的整体贡献均较少。在风格因子上,机构主动资金偏好在市值因子上长期正向的暴露。 风险提示 本报告基于历史数据进行测试,历史回测结果不代表未来收益,未来市场风格可能发生切换。 1国内股票行情数据简介 1.1A股市场成交额和市值变化 成交额的变化 A股市场成立近30年来,全市场股票数量不断增加,日成交额此起彼伏。如图 表1,以中证全指(000985.SH)为例,在2015年大牛市,日成交额一度出现历史高值2万亿以上,之后成交额急剧下降,直到2019年初开始震荡式回升。疫情后,市场资金宽松,再次出现连续多个交易日全市场日成交额达到1万亿规模以上的情况。 图1:中证全指(000985.SH)日成交额变化 总市值、流通市值和换手率(基于流通市值)的变化 从图表2中可以看出,中证全指(000985.SH)的总市值和流通市值几乎同步平稳上升,而换手率从2015年下降后,长期较为平稳。 图2:中证全指(000985.SH)总市值、流通市值和换手率(基于流通市值) 股票数量、个股平均总市值变化 从图表3中可以看出,中证全指(000985.SH)的股票数量从2011年的1800多只增加到2022年的4200多只,增加近2400多只。但个股平均总市值,长期处于200亿的均值附近。由此可见,全市场总市值的增长,更多的是由股票发行所贡献的,而个股平均总市值的贡献比较小。 图3:中证全指(000985.SH)股票数量、个股平均总市值 1.2A股市场推送行情数据简介 截止到2022年6月10日,国内股票交易所推送的常用的盘中实时行情数据如图 表4所示(表格中只列出部分数据),数据主要分成两大类:截面数据、逐笔数据。国内股票市场截面数据最高频率为3s;逐笔数据没有固定频率,属于事件驱动型数据推送,交易所处理的每一笔委托单和撮合单都会被推送。 图4:国内上交所和深交所常用的盘中数据推送 1.3分笔Level2行情数据 如图表5所示,逐笔成交数据的主要字段。每个输入市场的买订单和卖订单都会被分配一个独立的编号,并且在当前交易日是互斥的。 图5:逐笔成交数据主要字段 2基于Level2数据追踪机构主动资金 2.1机构主动资金定义 如图表5所示,每一笔撮合成交都对应一个买单编号和卖单编号。当buy_id的编号值大于sell_id的编号值时,表示buy_id对应的订单为主动方。 机构主动资金定义如图表6所示:(与图表5中的字段对应) 图6:机构主动资金的定义计算步骤: 2.2因子构建 基于机构主动资金因子构建如图表7所示: 图7:机构主动资金因子构建 2.3因子评测 数据预处理: 移动窗口参数n遍历(63,126,252),日频数据 逐日将中证全指成分股数据原始因子值进行横截面升序排序 (对RETAMT因子排序后的值多空分别进行镜面翻转处理,即:每个截面的排序值离排序中位值越近,输出的值越大。) 逐日将横截面升序值分成5组 分5组、近年收益: 图8:RETAMT、ABSR因子各参数横截面分档年化收益率表现 图9:RETAMT_063d横截面分组年化收益率 图10:RETAMT_126d横截面分组年化收益率 图11:RETAMT_252d横截面分组年化收益率 图12:ABSR_063d横截面分组年化收益率 图13:ABSR_126d横截面分组年化收益率 图14:ABSR_252d横截面分组年化收益率 分5组long-short的PNL和换手率 如图表15,常见量价因子RETAMT的long-short的PNL时序平稳度一般。 图15:RETAMT各参数,横截面分5组,long-short表现 图16:RETAMT各参数,long-short每日单边换手率 如图表17,机构主动资金因子ABSR的long-short的PNL时序平稳度明显好于常见的量价因子RETAMT。 图17:ABSR各参数,横截面分5组,long-short表现 图18:ABSR各参数,long-short每日单边换手率 因子相关性矩阵 如图表19,两类不同视角构建的因子,相关性比较低。 图19:RETAMT、ABSR因子各参数横截面排序值相关性矩阵 因子各参数横截面升序值组合后评测 在进行因子参数遍历时,常用的方法是选取参数热力图中部的值,防止出现数据孤岛现象。但这种方式往往容易出现对每个因子进行参数选取时,出现过度优化情况,即每个因子都选参数热力图中部表现较好的点。这会导致最终的回测结果与实盘表现产生较大偏差。为了减少这种过度优化,本文参数选取采用面选取的方式而非点选取,即将一个面的参数对应的因子进行算术平均,这样可以减少优化程度。 单因子各参数组合方法 将每个参数的原始因子值进行横截面升序排序。 将各参数横截面升序值求横截面的算术平均,得到升序平均值。 (RETAMT、ABSR各参数组合分别为RETAMT均值、ABSR均值因子) 将升序平均值进行横截面分5组统计分档收益。 单因子各参数组合因子横截面升序平均值的分档收益如图20: 图20:因子横截面升序平均值的分档收益 RETAMT均值、ABSR均值因子,横截面分5组,long-short的PNL如图表21,机构主动资金ABSR均值因子平稳度明显好于常见的量价RETAMT均值因子。 图21:RETAMT均值、ABSR均值因子,横截面分5组,long-short表现 图22:RETAMT均值、ABSR均值因子,long-short每日单边换手率 图23:RETAMT均值、ABSR均值因子横截面排序值相关性矩阵 3因子组合回测 通过不同宽基指数的成分股来限定股票池,进行因子组合回测,分别在中证全指数(000985.SH)、沪深300(000300.SH)、中证500(000905.SH)和中证1000(000852.SH)上进行了回测。 因子的组合在不同的宽基指数上的表现有所不同,具体表现:宽基指数成分股涵盖越多,因子组合的信息比率越高,这展现出机构主动资金的快速轮动效应,以及在股票数量多的样本中区分度要好于股票数量少的样本中。例如限定股票在沪深300指数成分股上,组合因子的信息比率很低,从行为上推断为:当机构主力资金进入沪深300成分股后,不会形成较强的趋势效应,被机构主力资金大量买入的个股相对于沪深300其他成分股而言,没有明显的alpha收益。但如果将成分股扩展到中证全指上,机构主力资金流动带来的趋势效应比较明显,被机构主力资金大量买入的个股相对于中证全指其他成分股而言,有明显的alpha收益。 将两个不同视角的单因子各参数组合后的均值因子,RETAMT均值因子和ABSR均值因子,进行逻辑组合,组合回测方式如下: 限定宽基指数的成分股范围。 将RETAMT均值、ABSR均值因子分别再次进行横截面升序排序。 将RETAMT均值升序值、ABSR均值升序值逐日横截面分5组。 买篮子:逐日取RETAMT均值升序值第5组和ABSR均值升序值第5组的交集对应的股票池。 卖篮子:买篮子股票的ABSR均值升序值降为第3组以下时(含),进行卖出。 降频处理:得到每日的买、卖篮子后,进行周度采样降低频率。 手续费:双边共 2‰。 成交限定:次日收盘价作为成交价,去除一字涨停的买单和一字跌停的卖单。 3.1中证全指股票池回测 如图表24所示,组合因子在中证全指上总超额收益为206.26%,超额年化收益率为9.16%,信息比率为0.84。整体来看,组合因子能获取超额收益,并且随着中证全指成分股数量的增加,持股数量也相应增加。从2020年以来,持股数量在1100-1400只之间,策略容量上限大。 图24:中证全指,RETAMT均值、ABSR均值因子组合回测收益 3.2沪深300股票池回测 如图表25所示,组合因子在沪深300上总超额收益为29.87%,超额年化收益率为1.87%,跟踪误差为5.27%,信息比率为0.39。整体来看,组合因子在沪深300上获取的超额收益远少于中证全指。机构主动资金在沪深300上的区分度远不如中证全指上,因为当机构主力资金流入到中小盘个股上时,沪深300上的趋势效应就会明显弱化。在沪深300上的持股数量中值约为80只股票。 图25:沪深300,RETAMT均值、ABSR均值因子组合回测收益 3.3中证500股票池回测 如图表26所示,组合因子在中证500上总超额收益为52.03%,超额年化收益率为2.96%,跟踪误差为4.95%,信息比率为0.66。整体来看,组合因子在中证500上获取的超额收益远少于中证全指,但好于沪深300。机构主动资金在中证500上区分度的问题也和沪深300一样,当机构主力资金大规模流出中证500时,中证500的趋势效应就会明显弱化。在中证500上的持股数量中值约为130只股票。 图26:中证500,RETAMT均值、ABSR均值因子组合回测收益 3.4中证1000股票池回测 如图表27所示,组合因子在中证1000上总超额收益为80.79%,超额年化收益率为4.39%,跟踪误差为5.71%,信息比率为0.82。整体来看,组合因子在中证1000上获取的超额收益依然远少于中证全指,但好于沪深300和中证500。机构主力资金在股票数量多的样本中区分度要好于股票数量少的样本中。在中证1000上的持股数量中值约为260只股票。 图27:中证1000,RETAMT均值、ABSR均值因子组合回测收益 4因子组合回测-扩大股票池指数增强 通过向更小市值的宽基指数扩充股票样本数量,来增加机构主力资金的区分度。 在中证800指数成分股中选股,做相对于沪深300指数的增强收益;在中证800指数+中证1000指数的成分股中选股,做相对于中证500指数的增强收益。如图表25与 图表28对比,基准为沪深300;图表26与图表29对比,基准为中证500。增加选股池的范围,能比较明显的增强相对于基准的收益。这表明了机构主动资金在大股票池里的选股区分度要大于小股票池。 图28:沪深300增强-中证800选股,因子组合回测收益 4.2中证500指数增强-限定中证800+中证1000股票池 将股票池限定为中证800+中证1000,组合因子相对于中证500总超额收益为109.80%,超额年化收益率为5.62%,跟踪误差为5.86%,信息比率为0.98。持股数量提升到中值约为500只股票。 图29:中证500增强-中证800+中证1000选股,因子组合回测收益 5Barra归因分析 5.1中证全指股票池回测-收益归因 如图表30和图表31,中证全指股票池的相对收益分解来看。机构主动资金长期在行业因子没有明显暴露,其