您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列:基于委托订单数据的alpha因子 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列:基于委托订单数据的alpha因子

2021-07-22朱剑涛、王星星东方证券℡***
因子选股系列:基于委托订单数据的alpha因子

东方证券股份有限公司经相关主管机关核准具备证券投资咨询业务资格,据此开展发布证券研究报告业务。 东方证券股份有限公司及其关联机构在法律许可的范围内正在或将要与本研究报告所分析的企业发展业务关系。因此,投资者应当考虑到本公司可能存在对报告的客观性产生影响的利益冲突,不应视本证券研究报告为作出投资决策的唯一因素。 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 专题报告 【金融工程·证券研究报告】 金融工程 基于委托订单数据的alpha因子 ——因子选股系列之七十六 研究结论 ⚫ 逐笔委托订单数据包括了投资者于何时以什么价格买入或者卖出多少量股票的委托信息,而且标记了新增或者撤回的时间戳,理论上讲可以根据逐笔委托数据和交易所撮合规则重现整个交易过程,因此逐笔委托几乎包括了股票所有的交易层面信息。 ⚫ 上交所和深交所的逐笔委托数据结构有所不同,具体体现在市价单、订单撤回等细节处理上,深交所逐笔委托数据最早可追溯至2012年下半年,上交所逐笔委托2021年5月才开始提供,本文的研究主要以深交所股票为主,基于上交所数据同样可以构建相同因子从而实现全A股覆盖。 ⚫ 开盘集合竞价第一阶段的委托单可以随意撤回,该阶段可以通过委托撤回的方法在不需要成交的情况下测算对手盘挂单的价和量,基于此,我们构建了盘前撤单比例因子用于度量股票的“镰刀”占比,盘前撤单比例越高,股票未来收益平均越差。 ⚫ 早盘半小时的交易更多是对夜间信息的反应,通过测算早盘买入和卖出订单的委托量大小可以判断资金雄厚的投资者在买入还是卖出,跟踪大资金的早盘交易可以获取超额收益,本文直接通过早盘买入和卖出卖出订单大小的比值作为alpha因子避免了主动买卖划分方法对因子构建的影响。 ⚫ 委托订单的价格反应了投资者对股票价值的认可,我们通过委托订单价格的差异化程度可以刻画投资者对股票价格的分歧程度,在缺乏做空机制的市场下,投资者的分歧会导致股价短期高估,进而影响股票未来的收益。 ⚫ 投资者委托订单的价格不可避免会受最近成交价格的影响,本文用订单相对价格分歧程度度量投资者委托订单价格相对最近成交价格偏离的差异化程度。订单相对价格分歧程度相对绝对价格分歧程度选股表现略差,但和其他因子相关性更低,信息更加独立。 ⚫ 本文基于买入订单的委托数据改进了APB因子,在价格相对低位有大量买入订单的股票未来收益相对更高,改进后的APB因子相对原APB因子在RankIC、多空收益、分组表现等方面都有提升,而且在近年来原APB因子回撤时依然表现较好。 ⚫ 通过相关性分析,早盘买卖单大小比和订单相对价格分歧程度两个因子和常见alpha因子相关性都处于较低的水平,盘前撤单比例、订单相对价格分歧程度和波动、换手等投机性指标有一定信息重叠,改进后的APB相对原APB有明显的信息增量。 风险提示 ⚫ 量化模型失效风险 ⚫ 市场极端环境的冲击 ⚫ 深交所规律在上交所的适用性风险 Table_ Base Info 报告发布日期 2021年07月22日 证券分析师 朱剑涛 021-63325888*6077 zhujiantao@orientsec.com.cn 执业证书编号:S0860515060001 证券分析师 王星星 021-63325888*6108 wangxingxing@orientsec.com.cn 执业证书编号:S0860517100001 相关报告 适用A股不同股票池的统计风险模型:——《因子选股系列研究 之 七十五》 2021-06-03 神经网络日频alpha模型初步实践:——因子选股系列之七十四 2021-03-11 更稳健易算的分析师盈利上调因子:——《因子选股系列研究 之 七十三》 2021-03-09 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、数据说明 ................................................................................................. 3 2.1 股票订单数据 .............................................................................................................. 3 2.2 因子测试说明 .............................................................................................................. 3 二、盘前撤单比例 .......................................................................................... 4 2.1 因子定义 ...................................................................................................................... 4 2.2 因子表现 ...................................................................................................................... 4 三、早盘买卖单大小比 ................................................................................... 6 3.1 因子定义 ...................................................................................................................... 6 3.2 因子表现 ...................................................................................................................... 6 四、订单价格分歧程度 ................................................................................... 8 4.1 因子定义 ...................................................................................................................... 8 4.2 因子表现 ...................................................................................................................... 8 五、订单数据改进的APB因子 .................................................................... 10 5.1 因子定义 .................................................................................................................... 10 5.2 因子表现 .................................................................................................................... 10 六、因子相关性分析 .................................................................................... 12 6.1 与常见大类因子相关性 .............................................................................................. 12 6.2 与常见量价因子相关性 .............................................................................................. 13 七、结论 ...................................................................................................... 15 风险提示 ...................................................................................................... 15 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 3 一、数据说明 2.1 股票订单数据 A股的L2行情数据包括逐笔成交数据、盘口快照数据、委托队列数据和逐笔委托数据,上交所和深交所L2数据的数据结构、推送规则均有所差异。早期仅深交所提供股票订单委托的明细数据,基于股票订单委托明细构建的alpha因子仅覆盖深交所股票,因此研究相对较少,但自2021年5月开始上交所的L2数据也新增了订单委托明细,自此股票订单明细数据覆盖沪深两市。理论上讲,对于某只股票,已知所有的挂撤单明细,整个交易过程均可以通过撮合规则模拟出来,那么逐笔成交、盘口快照、委托队列等其他L2数据也可以根据逐笔委托生成,由于数据收集的精度等原因,基于挂撤单数据模拟生成的L2数据和交易所发布的数据会有些许偏差,尽管会有偏差,但这在一定程度上也说明了股票的订单数据蕴含了几乎所有的交易层面的信息,研究的价值很大。 上交所和深交所的逐笔委托数据结构并不相同,两者都包括订单时间、委托单号、委托价格、委托量、委托方向等常规字段,但委托类型的含义并不相同,上交所的委托类型表示该委托是新增订单还是撤回订单,而深交所的订单类型表示的是订单是限价单还是市价单。上交所只有“最优五档剩余撤销“和”最优五档剩余转限价”两种市价订单,都可以转换为限价订单和撤单委托的组合表示,因此从数据上看没有专门的市价委托分类。另外,深交所委托订单是否撤回以及撤回的量需要根据委托单号关联到逐笔成交数据中查看。 图1:逐笔委托数据核心字段 数据来源:Wind、上交所、深交所、东方证券研究所 2.2 因子测试说明 由于截止报告撰写日期上交所股票仅有两个月的委托订单明细数据,所以本文因子测试的股票池仅包括相应样本空间深交所部分,考虑到数据可获得性,因子测试区间起止于20121231-20210630。 字段名数据类型字段说明备注StkCdASCII字符串证券编码OrderDate日期日期OrderTime时间时间时:分:秒.毫秒Rec_no正整数委托单号Size双精度浮点数委托量Price双精度浮点数委托价格order_kindASCII 字符串委托类型深交所:0:限价委托