您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列之七十九:基于大单的alpha因子构建 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列之七十九:基于大单的alpha因子构建

2021-10-27朱剑涛、王星星东方证券劫***
因子选股系列之七十九:基于大单的alpha因子构建

东方证券股份有限公司经相关主管机关核准具备证券投资咨询业务资格,据此开展发布证券研究报告业务。 东方证券股份有限公司及其关联机构在法律许可的范围内正在或将要与本研究报告所分析的企业发展业务关系。因此,投资者应当考虑到本公司可能存在对报告的客观性产生影响的利益冲突,不应视本证券研究报告为作出投资决策的唯一因素。 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 专题报告 【金融工程·证券研究报告】 金融工程 基于大单的alpha因子构建 —— 因子选股系列之 七十九 研究结论 ⚫ 大单背后对应着资金实力更雄厚的投资者,这部分投资者相对来说更具有信息优势,跟踪大单的交易行为可能获取一定的超额收益。 ⚫ A股逐笔委托明细数据有每个订单大小的标识,但历史上仅深交所股票有覆盖,为了增加因子历史覆盖率,本文基于逐笔成交的委托单号合成订单成交金额大小,并基于此划分大小单。 ⚫ 考虑到计算便利性、不同个股的差异性,我们取股票当天订单成交金额最大的5%的订单作为大单,平均金额阈值为12.3万元,累计金额占比46.3%,近年来由于算法拆单等原因,订单5%金额阈值有所下降,但累计占比几乎维持不变,说明大单拆单后大概率依然属于大单。 ⚫ 为了跟踪大单的买入方向,我们用大单买入占比度量了股票每日大单中买入方向的金额占比,考虑到更多的信息交易发生在早盘,我们也度量了上午10:00前的早盘大单买入占比。 ⚫ 无论是大单买入占比还是早盘大单买入占比,大单买入占比高的股票普遍优于卖出占比高的股票,从因子RankIC和多空来看,早盘大单买入占比选股表现在各个样本空间均优于大单买入占比。 ⚫ 大盘买入占比和早盘大单买入占比,在大市值股票池中的选股效果显著优于小市值股票池,早盘大单买入占比在沪深300中月度RankIC均值高达7.33%,多空年化收益为25.4%,而在中证全指中的RankIC仅3.27%,多空年化收益12.0%,从时间序列上看,因子近两年也没有衰减的迹象。 ⚫ 微观上讲股票每一次价格变动都源于主动订单的推动,本文汇总所有主动大单导致的涨跌幅变化得到大单涨跌幅,因子检验结果显示过去一段时间大单涨跌幅高的股票未来平均收益率更高。 ⚫ 大单涨跌幅和早盘大单涨跌幅因子在各个样本空间RankIC几乎一致,基于早盘计算的大单涨跌幅相对更优,在沪深300中的月度RankIC均值7.37%,多空年化收益20.4%。 ⚫ 本文提出的4个因子对大单的划分标准并不敏感,在较长平滑周期下,因子的换手率大幅降低,但因子的选股效果回落幅度有限,比如年度平滑的早盘大单买入占比因子在沪深300中的月均RankIC均值依然高达7.17%,多空年化收益15.36%,但top组合月单边换手仅20%。 ⚫ 大单买入占比、早盘大单买入占比在因子取值上和多数大类因子几乎没有任何相关性,和反转有较强的负相关,因子表现和反转完全互补,呈现一定的动量特征。 ⚫ 大单涨跌幅和早盘大单涨跌幅偏好选择低波和流动性差的股票,对于该类型的股票,大单的冲击更容易反应在涨跌幅上。 风险提示 ⚫ 量化模型失效风险 ⚫ 市场极端环境的冲击 Table_ Base Info 报告发布日期 2021年10月27日 证券分析师 朱剑涛 021-63325888*6077 zhujiantao@orientsec.com.cn 执业证书编号:S0860515060001 证券分析师 王星星 021-63325888*6108 wangxingxing@orientsec.com.cn 执业证书编号:S0860517100001 相关报告 存在于全市场范围内的稳健动量效应:——《因子选股系列研究 之 七十八》 2021-09-02 “居中”和“离群”股的Alpha:——《因子系列选股研究之七十七》 2021-08-15 基于委托订单数据的alpha因子:——因子选股系列之七十六 2021-07-22 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、数据说明 ................................................................................................. 3 1.1 大单的识别 .................................................................................................................. 3 1.2 因子测试说明 .............................................................................................................. 4 二、大单买入占比 .......................................................................................... 4 2.1 因子定义 ...................................................................................................................... 4 2.2 因子表现 ...................................................................................................................... 4 三、大单涨跌幅 ............................................................................................. 6 3.1 因子定义 ...................................................................................................................... 6 3.2 因子表现 ...................................................................................................................... 6 四、因子稳健性分析 ...................................................................................... 8 4.1 不同大单划分下的因子表现 ......................................................................................... 8 4.2 不同平滑周期下的因子表现 ......................................................................................... 9 五、因子相关性分析 .................................................................................... 10 5.1 与常见大类因子相关性 .............................................................................................. 10 5.2 与常见量价因子相关性 .............................................................................................. 11 六、结论 ...................................................................................................... 12 风险提示 ...................................................................................................... 12 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 3 一、数据说明 1.1 大单的识别 A股的L2高频数据包含所有股票逐笔委托和逐笔成交的明细过程,通过分析委托和成交的过程可以解析资金的意图,从而发现可能的交易机会。无论是买入委托单还是卖出委托单,订单的金额大小在一定程度上反应了订单背后投资人的资金实力,大订单背后对应着资金实力更强的投资者,他们在股市博弈中也处于主导地位,本文主要基于大单的行为捕捉可能对选股有价值的alpha因子。 在L2数据中,订单的实际大小可以直接从委托明细中获取,但是上交所的委托明细数据从2021年5月开始才开始对外商业推送,历史数据没有覆盖,为了让因子的历史数据覆盖沪深两市,我们可以采用订单的已成交大小去拆分大小单。无论上交所还是深交所2013年之后带委托单号的成交明细数据已经比较完善,我们可以根据委托单号汇总该单号对应的每笔成交量或者成交额,进而可以获知该订单的已成交部分的大小。显而易见,受撤单等因素影响,订单已成交大小不会超过订单的实际大小,和实际大小有一定差异,但在一定程度上也可以表征该订单背后的资金实力情况。 大单小单的划分方法目前尚没有一致认可的方法,根据分布的异常临界点、绝对金额划分都是可行的方法,本文考虑到计算的便利性、不同个股的差异性,在每个交易日每只股票选择金额最大的订单数量占比5%的订单作为大单,分析这部分订单的行为。从A股订单已成交金额的分布来看,最大的前5%订单累计金额占比达到近一半(46.3%),最大的前1%订单累计也占比达到21.7%,但从绝对金额上看前5%的订单并不是很大,平均为12.3万元,近年来也有明显下降的趋势,可能与算法交易的拆单有关,但订单前5%的金额占比并没有下降,暗示前5%的订单即使拆完单可能也处于较高的水平。 图1:A股订单已成交金额(元)分布情况(20天滚动) 数据来源:wind咨询、上交所、深交所、东方证券研究所 前1%前5%前10%前25%中位数均值后25%前1%累计占比前5%累计占比前10%累计占比375061.5123389.368757.426241.410140.832609.34277.021.7%46.3%60.4% 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 4 1.2 因子测试说明 本文的主要目的是基于日内的大单数据提取对选股可能有用的特征,为了验证这些特征的选股有效性,我们取这些日内特征过去20天的均值用于选股,在月度调仓层面从RankIC和多空分组两个角度考察因子在各个样本空间的选股效果,考虑到数据可获得性,因子测试区间起止于20131231-20210930。 二、大单买入占比 2.1 因子定义 大单背后的投资者资金实力相对更加雄厚,假设我们认为这个