AI智能总结
西部证券研发中心2025年9月12日 分析师|冯佳睿S0800524040008邮箱地址:fengjiarui@xbmail.com.cn联系人|张逸飞邮箱地址:zhangyifei@xbmail.com.cn 主要结论 本文聚焦下单-撤单时间差这一特殊的订单薄特征,挖掘算法交易驱动的订单带来的alpha。 【报告亮点】 •通过下单-撤单时间差的视角,对算法交易驱动的撤单进行识别与交易逻辑分析。•构建的算法交易买单撤单占比(BABR)与算法交易买卖撤单熵(ACE)因子具有较强选股效果。 【主要逻辑】 •下单-撤单时间差分布呈现脉冲式集中,集中的时间点可能代表了算法交易驱动的撤单行为。统计这类算法交易撤单与全部撤单的比例,构建算法交易撤单数占比因子(ACCR),因子全区间RankIC达到0.052,ICIR为0.458。•进一步细分撤单的买卖特征,发现买单算法交易撤单笔数/全部买单撤单笔数(BABR)全区间RankIC达到0.059,ICIR达到0.555,IC胜率70.1%。与市值因子、Barra风格因子中性化后,BABR因子仍保留一定选股能力。•构建算法交易买卖撤单熵(ACE)因子,通过引入撤单熵,描述了算法撤单中买卖双方的意见:买卖意见一致性越高,因子值越大。因子RankIC达到0.047,ICIR为0.479。•将ACE与BCBR分别进行横截面排序并转化为百分比排名,两个排名相加得到合成因子。合成因子全区间RankIC达到0.069,ICIR为0.851,IC胜率达到81.5%。IC和IC稳定性相较单因子均有显著提升。选取因子值前100的股票等权组合,双周调仓,策略年化收益率为13.03%,超额年化收益率为13.77%,信息比率为1.44。 风险提示:数据来源第三方,或有遗漏、滞后、误差;本报告使用历史数据测算完成,存在历史统计规律失效风险;模型假设或与实际市场情况存在差异;市场风格变化风险:市场投资风格可能发生变化,影响当前因子的有效性。 算法交易撤单占比 算法交易买单撤单占比 03 算法交易买卖撤单熵 撤单占比与撤单熵的合成05 07 08 一、引言 近年来,随着算法交易的普及,机构为降低冲击成本更倾向于拆分小单 •《TrackingRetailandInstitutionalInvestorsActivityinChina》一文将4万元与20万元作为小中大单的划分标准,并统计每种订单中实际交易者的占比; •2017年以来,小单中机构订单的占比逐渐攀升,大单中机构订单的占比则有所回落,传统“大单=机构”假设削弱。 一、引言 受算法拆单影响,以挂单金额划分的“机构订单”已难以真实反映机构行为 •2013年以来,沪深两市总成交金额整体呈现上升趋势,但平均每笔交易金额明显下滑; •目前主流金融软件和数据库仍按绝对金额划分订单,偏离真实机构交易特征。 二、算法交易撤单占比 下单-撤单时间差分布呈现脉冲式集中,可能代表了部分算法交易驱动的行为 •UBS在《IdentifyinghumanversusalgotradingintheChinamarket》一文中提出,集中出现的下单-撤单时间差可能反映了由算法交易预设的撤单规则: •自然交易:撤单时间差应随机或在一些时间段内大致均匀分布。 •异常特征:若撤单集中在特定时间点,且符合一定交易逻辑→可能为算法交易预设的行为。 二、算法交易撤单占比 算法交易撤单时间点的确认 •进一步观察10s内的撤单,发现主要集中在几个时间上:0s附近,1s,3s,5s,6s,9s•基于以上发现和机构交易逻辑(散户接触到算法交易程序的比例与金额有限),我们将假设以下几个时间点为算法交易撤单设定的时间点•1s,5s:整秒时点,统计显示撤单行为显著集中;•10分钟内的3s整数倍:与快照更新周期吻合,机构通常不愿长时间持有未成交订单;•尽管0s附近有大量撤单,但可能缺乏实际交易意图,暂不纳入有效撤单时点。 二、算法交易撤单占比 算法交易撤单占比因子ACVR、ACCR •基于上述逻辑,对沪深两市所有撤单进行撤单时间的计算与判定。 •开盘集合竞价前五分钟虽然可以撤单,但因无实际撮合交易,只对9:30之后的订单做计算。 •考虑到可能的延迟,将指定时点前后20ms内的撤单一同纳入计算。 •聚合过去10个交易日(滚动)每只股票由算法交易驱动的撤单和全部撤单信息: 算法交易撤单量占比(AlgorithmCancelVolumeRatio)=算法交易撤单量/全部撤单量算法交易撤单笔数占比(AlgorithmCancelCountsRatio)=算法交易撤单笔数/全部撤单笔数 二、算法交易撤单占比 算法交易撤单量占比(ACVR) •回测设置:2017.01-2025.08,沪深两市A股,剔除ST、*ST及上市不满一年的股票;预测未来十天(t+1至t+11的VWAP收益) •ACVR因子多空收益稳定且多头超额收益显著,但全区间RankIC仅有0.026,且ICIR较低。 二、算法交易撤单占比 算法交易撤单数占比(ACCR) •相较ACVR因子,ACCR因子依旧多空稳定,多头收益显著。 •因子全区间RankIC达到0.052,相比ACVR的0.026提升明显,ICIR也由0.219上升至0.458。 二、算法交易撤单占比 “秒撤”的撤单不提供额外信息增益 •此前判定算法交易订单时,因考虑到20ms内的“秒撤”订单缺乏实际交易意图,故将其排除。•如果将“秒撤”订单纳入算法交易订单,全区间RankIC反而有所下降,ICIR和胜率基本不变。•从交易逻辑和选股效果出发,维持原先的ACCR因子定义。 二、算法交易撤单占比 相较撤单量,笔数的统计特征更稳定,不易受极端值影响 •笔数(ACCR):捕捉稳定的行为模式 •统计特征稳定:笔数统计不易受极端值干扰,横截面稳定性更强;•信息纯度更高:撤单笔数直接反映了下单与撤单的积极性与策略意图,与市场微观结构的变化密切相关,信息含量更高。 •撤单量(ACVR):噪声更大的“资金强度” •易受极端值干扰:单笔大额撤单(通常为主观决策)即可显著扭曲因子值,引入大量噪声; •信息价值有限:撤单行为本身不涉及真实成交,其“资金强度”是一个虚值信号,无法有效代表真实的行为特征,因此预测能力较弱。 •对于撤单这类特殊的订单薄行为,发生“频次”比涉及“金额”更能揭示纯粹的交易意图与市场信息,因此ACCR因子的表现显著优于ACVR。 二、算法交易撤单占比 ACCR因子全市场平均走势与机构小单占比及算法交易发展一致,具有一定参考意义 •将全市场ACCR的因子值做日度平均,可以大致分为几个阶段:•2017-2020.05:因子走势与论文中机构订单在小单中的占比变化大致一致。•2020.06-2021:算法交易应用逐渐广泛,因子值震荡上升。•2022-至今:因子值稳定在6%-8%的区间,算法交易的应用基本稳定。 三、算法交易买单/撤单占比 根据撤单的买卖逻辑细分因子 •ACCR的计算只关注算法交易撤单发生的频次,不区分订单其他信息,进一步细分订单买卖方向可能带来新的信息增益。 •撤单里的买单(原意图为买入)和卖单(原意图为卖出)代表了交易者对资产未来价格有截然相反的预期。 •两类订单市场含义不同,其撤单行为所蕴含的信号强度也可能存在差异。 •根据下单时的交易方向(买单/卖单)可以进一步构建四个因子: 买单算法交易撤单笔数/全部撤单笔数(BuyAlgorithm cancelv.s.All cancelRatio)卖单算法交易撤单笔数/全部撤单笔数(SellAlgorithm cancelv.s.All cancelRatio)买单算法交易撤单笔数/全部买单撤单笔数(BuyAlgorithm cancelv.s.Buy cancelRatio)卖单算法交易笔数/全部卖单撤单笔数(SellAlgorithm cancelv.s.Sell cancelRatio) 三、算法交易买单/撤单占比 买单算法交易撤单笔数/全部买单撤单笔数(BABR)因子在IC和多头收益上表现最优 •综合IC和多头超额收益表现,基于买单计算的因子比基于卖单计算的因子选股效果更优: •买单撤单更能反映机构吸筹,带有一定的建仓意图。 •BABR因子是用全部买单撤单笔数做标准化,噪音更少,选股效果稍有提升。 三、算法交易买单/撤单占比 算法交易买单撤单数占比(BABR) •BABR因子全区间RankIC达到0.059,ICIR达到0.555,IC胜率70.1%。•BABR因子多空收益稳定且多头超额收益明显,选股效果较强。 三、算法交易买单/撤单占比 BABR因子与Beta、成长保持稳定正相关性,与账面市值比、盈利、杠杆保持稳定负相关性 •从Barra相关性出发,BABR因子偏好高Beta、高估值、成长性强且财务风险低的股票。•2020年起因子与对数市值呈现稳定的轻微负相关,但2025年的负相关性显著上升。 三、算法交易买单/撤单占比 剥离Barra风格因子后,BABR因子依旧保留选股能力。 •2025年因子表现较好,但有明显的小市值暴露。剥离市值后,2025年因子IC略有下降(原0.110),但全区间IC变化较小。 •进一步对所有Barra因子做中性化,全区间RankIC为0.043,ICIR和胜率有所提升,因子保留选股能力。 四、算法交易买卖撤单熵 信息熵 •虽然BABR因子在全区间选股表现较好,但2022-2024年持续表现较差,且ICIR较低。 •因子构建仅从买单视角出发,可能存在局限。 •为更好诠释买卖双方的视角,引入信息熵的概念: 信息熵=−log,=随机事件݅发生的概率 •对于信息熵,如果一个事件发生的概率为100%,信息熵为0;如果事件发生的概率越分散,信息熵越大。 四、算法交易买卖撤单熵 算法交易买卖撤单熵 •因子构建主要关注算法交易撤单中买/卖撤单的方向一致性,因此我们定义 算法交易买卖撤单熵(ۯlgorithm۱ancel۳ntropy)=log,=某类撤单量/总算法撤单量 •每日对每只个股计算算法交易买卖撤单熵值,滚动十日平均作为最终的因子值。 •与传统熵不同,ACE取相反数: •买/卖撤单完全一致→ACE最大(方向清晰,信息集中) •买/卖撤单均衡分散→ACE最小(方向不明,信息弱) 四、算法交易买卖撤单熵 算法交易买卖撤单熵ACE •ACE因子全区间RankIC达到0.047,ICIR为0.479。 •因子多空收益稳定,分五组单调性明显,但多头收益稍弱于占比类因子。 •从因子定义出发,因子值较高仅代表算法撤单内部方向一致,并不区分一致性体现在买单还是卖单上,因此多头收益较弱。 五、撤单占比与撤单熵的合成 根据ACE因子值将全市场股票划分为两部分 •算法交易买单撤单数占比因子BABR与算法交易买卖撤单熵ACE相关性仅为-6.09%,合成可能有更好的选股表现。•根据ACE因子值的大小将选股池分为两部分作为算法撤单意见一致和混乱的划分,分别计算BABR的选股表现。•在ACE较高(算法撤单买卖意见一致)的股票内,BCBR因子的RankIC、ICIR、IC胜率显著更优。 五、撤单占比与撤单熵的合成 合成因子选股能力显著,2022-2024年选股效果相较单因子提升显著 •合成因子:将ACE与BCBR分别进行横截面排序并转化为百分比排名,相加后即为合成因子。 •合成因子全区间RankIC达到0.069,ICIR为0.851,IC胜率达到81.5%,IC和IC稳定性相较单因子均有显著提升。 •因子多空收益稳定,多头和空头表现均衡,单调性显著,呈现出较强的选股能力。 五、撤单占比与撤单熵的合成 市值、流动性中性化后,合成因子仍保留较强选股能力 •合成因子与市值因子的全