金融工程专题 2022年12月25日 日内分钟收益率的时序特征:逻辑讨论与因子增强 金融工程研究团队 ——市场微观结构研究系列(19) 魏建榕(首席分析师) 魏建榕(分析师)苏良(联系人)盛少成(联系人) 证书编号:S0790519120001 weijianrong@kysec.cn 证书编号:S0790519120001 suliang@kysec.cn 证书编号:S0790121070008 shengshaocheng@kysec.cn 证书编号:S0790121070009 张翔(分析师) 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(研究员) 证书编号:S0790121070009 苏良(研究员) 证书编号:S0790121070008 何申昊(研究员) 证书编号:S0790122080094 相关研究报告 《高频因子:分钟单笔金额序列中的主力行为刻画—市场微观结构研究系列(15)》-2022.06.12 《日内极端收益前后的反转特性与因子构建—市场微观结构研究系列 (17)》-2022.12.03 《大小单重定标与资金流因子改进—市场微观结构研究系列(15)》 -2022.09.04 跌幅时间重心偏离是更适合刻画“时间差Alpha”的指标 涨、跌幅在时间轴上的分布位置捕捉了股票的交易行为特征,两者的相对位置也可能蕴含某种选股信息。 经过详细的测试,我们倾向于认为,涨、跌幅时间重心的相对位置是一个有效的 Alpha因子,但提取的方法并非是将二者简单做差,原因有二: (1)涨、跌时间重心存在较强的正相关。线性相关导致“时间差”的大小取决于起始位置,而这不符合一般定义:“时间差”在盘初、盘中或盘尾应是一致的。 (2)涨、跌时间重心的波动率水平存在差异。作差方法用于构造“时间差”信 息会使得因子暴露更多高波动成分(涨幅时间重心因子),因子有效性较弱。 我们以跌幅时间重心对涨幅时间重心在截面上回归取残差,再取其20日均值记为跌幅时间重心偏离因子,该因子更适合用以刻画“时间差Alpha”。 “时间差Alpha”的生效逻辑讨论 跌幅时间重心偏离能更有效地刻画日内分钟收益率时序特征的选股因子。但我们 对Alpha的逻辑解释仍然不清楚,于是,本章将从因子的层面探究其Alpha来源,推测主要有三种可能性:(1)收益率结构;(2)极端涨跌幅度or涨跌幅的分布位置;(3)A股市场的“低波效应”。 基于上述三个维度的讨论,我们找到了“时间差Alpha”的解释因子:(1)盘尾阶段的收益率;(2)零涨跌幅数量。中性化后的跌幅时间重心偏离因子几乎不具备选股能力,这也说明“时间差Alpha”是收益率结构和“低波效应”的综合。 因子增强方案:时间重心偏离(TGD)因子 因子改进思路较为简单,剥离可能影响“时间差Alpha”的干扰因子,在跌幅时间重心偏离因子的基础上改进得到时间重心偏离(TGD)因子。 TGD因子的有效性较原始因子大幅提升,全市场五分组下的多空信息比率达到 4.5以上,RankICIR为4.93,因子收益较为稳定。 同样基于收益率结构的APM因子是TGD因子的Alpha子集。通过相互回归的 方法证明,TGD因子在对APM因子中性化后仍然保留一定的选股信息,而APM 因子在回归掉TGD因子后几乎是噪音。 时序特征因子与分布特征因子合成后效果更佳 TCD因子属于时间维度的综合信息,并不受收益率分布的影响,如果与收益率分布的典型因子进行合成,效果还会继续提升。 本文选取分布特征的典型因子:日内收益率偏度SKEW因子作为代表,将TCD 因子与SKEW因子在横截面上排序加总得到合成因子。 合成因子相比TGD因子在稳定性方面进一步改善,RankICIR达到5.74。 风险提示:模型测试基于历史数据,未来市场可能发生改变。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、时序特征:跌幅时间重心偏离因子4 2、“时间差Alpha”的生效逻辑探究9 2.1、收益率结构对“时间差”的影响分析9 2.2、极端样本对时间差Alpha的影响分析12 2.3、基于“低波效应”与事件收益维度的解释15 2.4、“时间差Alpha”的综合解释模型16 3、“时间差”因子的选股方案设计17 3.1、时间重心偏离(TCD)因子构建17 3.2、因子相关性分析:波动和价值风格暴露分别为0.23和0.2118 3.3、持仓风格分析:整体偏向小票样本更有效20 3.4、基于多维度信息的因子合成21 4、风险提示22 图表目录 图1:日内收益率的时序特征:涨、跌幅的时间重心4 图2:截面上,涨幅和跌幅的时间重心呈正相关5 图3:涨、跌幅时间重心的截面相关系数分布5 图4:极端涨幅和极端跌幅的转换概率较高,说明在时间轴上的分布距离较近5 图5:涨跌幅时间重心存在日间差异5 图6:“时间差”的分布:样本越少,差异越大5 图7:涨幅时间重心因子为正IC,但效果较弱6 图8:跌幅时间重心因子:RankIC为0.0536 图9:“时间差”�所能提供信息增量有限7 图10:“时间差”�剥离𝑮�和𝑮𝒖,Alpha信噪比明显降低7 图11:跌幅时间重心偏离因子:RankIC为0.054,RankICIR接近3.07 图12:跌幅时间重心偏离因子RankIC累计值8 图13:跌幅时间重心偏离因子的相关网络图8 图14:跌幅时间重心偏离因子的Alpha独立于单个的时间重心8 图15:时间差与日内收益率正相关,与隔夜收益率负相关9 图16:剔除日内、隔夜收益率,因子有效性改善10 图17:时间差Alpha增强:多空IR达3.0110 图18:时间指标与隔夜、日内累计收益率的相关系数10 图19:时段1(09:31-10:00)涨跌幅分组单调性11 图20:时段2(10:01-10:30)涨跌幅分组单调性11 图21:时段3(10:31-11:00)涨跌幅分组单调性11 图22:时段4(11:01-11:30)涨跌幅分组单调性11 图23:时段5(13:01-13:30)涨跌幅分组单调性11 图24:时段6(13:31-14:00)涨跌幅分组单调性11 图25:时段7(14:01-14:30)涨跌幅分组单调性11 图26:时段8(14:31-15:00)涨跌幅分组单调性11 图27:剔除盘尾阶段收益率后,因子有效性降低12 图28:时间差Alpha减弱:RankICIR降至2.312 图29:极端样本的反转效应会对因子产生干扰13 图30:残差RankIC分布:极端反转影响Alpha收益13 图31:剔除极端收益率后,时间指标的有效性变化13 图32:跌幅时间重心偏离因子多空收益提升至17.9%13 图33:“时间差”因子Alpha来源与位置特征14 图34:回归涨、跌幅时间中心后,因子效果减弱14 图35:剔除时间中心后,时间指标的有效性变化14 图36:跌幅时间重心偏离因子的多空收益降低至12.5%14 图37:零涨幅数量为弱有效的正向因子:RankICIR为1.223,多空IR为0.8815 图38:剥离零涨跌幅或极端事件收益,Alpha减弱15 图39:极端事件的收益率统计:当日触涨属于利好15 图40:时间差Alpha的收益来源:收益率结构与低波效应17 图41:TGD因子月度RankIC及其累计值18 图42:全市场五分组表现:多空收益稳健18 图43:TGD因子与Barra风格因子相关性低19 图44:TGD因子与APM因子相关性较高19 图45:剥离Barra风格因子收益后,TGD因子多空信息比率仍有3.7719 图46:TGD因子的日历效应:整体收益稳定,10月份稍弱一些19 图47:TGD因子的多空对冲净值曲线:在全样本上表现更好20 图48:持仓100:市值风格整体偏向小票20 图49:TGD因子换手率相对中等,单笔换仓近40%20 图50:合成因子月度RankIC及其累计值21 图51:合成因子五分组表现:多空IR为4.4521 图52:合成因子的日历效应:稳定性相比TGD因子更强21 表1:两类时间重心因子以及“时间差”、“时间距离”因子的构造步骤6 表2:极端事件对时间差Alpha的影响16 表3:时间差Alpha的解释因子17 表4:TGD因子的计算步骤18 表5:不同选股域内五分组测试表现:全样本范围更有效20 表6:不同选股域内五分组测试表现:合成因子在沪深300内多头仍有超额21 在2022年6月,我们曾创新性构建了“分钟单笔成交金额”指标,从分布特征和时序特征维度开发出捕捉主力行为特征的高频因子,诸如QUA、MTS和MTE等因子在样本内外的表现均十分优异。在这一研究框架的基础上,本文将继续挖掘和探究更有效的高频信号,不妨让我们把关注点集中于分钟收益率的时序特征。 时间维度的信息会更加复杂和难以解释,而分钟收益率的时间戳与时间差的Alpha也早已被市场发现,但目前为止还没有研究能阐明其生效逻辑。于是,我们希望在本篇报告中解决两个关键问题: (1)什么是时间因子的Alpha解释?(2)如何改进因子使其变得更好? 1、时序特征:跌幅时间重心偏离因子 为了观察收益率的时序特征,我们将重新标注日内分钟时间戳,将09:31至15:00间的240根分钟Bar依次标记为1至240,然后分别统计价格上涨和价格下跌两组分钟Bar的时间标识序列,记作�和𝐷,对应的收益率序列为𝑅�和𝑅𝑑: (𝑈,𝑅𝑢)=[(𝑢1,𝑟𝑢),(𝑢2,𝑟𝑢),⋯,(𝑢𝑛,𝑟𝑢)] 12� (𝐷,𝑅𝑑)=[(𝑢1,𝑟𝑑),(𝑢2,𝑟𝑑),⋯,(𝑢𝑚,𝑟𝑑)] 12� 其中,𝑢�和𝑟�分别表示第�涨幅分钟的时间序号及收益率,𝑑�和𝑟�同理;�∈[1,𝑛] �� 而�∈[1,𝑚];由于不考虑分钟涨跌幅为零的序列,�+�≤240。图1:日内收益率的时序特征:涨、跌幅的时间重心 资料来源:开源证券研究所 图1展示了股票A在某日的分钟涨跌幅序列,涨幅较高和跌幅较大的分钟往往会靠得比较近,并呈现出一定的日内结构:股价在开盘半小时至一小时内变动幅度最大。我们以每分钟价格变动幅度对修正的时间戳加权平均,分别求得涨幅和跌幅的时间分布重心,记作𝐺�和𝐺𝑑: 𝐺�=𝑈𝑅𝑢𝑇⁄‖𝑅𝑢‖1 𝐺�=𝑈𝑅𝑑𝑇⁄‖𝑅𝑑‖1 我们统计某个交易日的截面上所有股票的涨、跌幅的时间重心的相关性,二者呈现出强正相关,相关系数可达0.7,结果如图2和图3所示。 图2:截面上,涨幅和跌幅的时间重心呈正相关图3:涨、跌幅时间重心的截面相关系数分布 数据来源:Wind、开源证券研究所数据来源:Wind、开源证券研究所 涨、跌幅时间重心之间的强相关性与A股市场整体上偏向于反转属性有关,当出现极端涨幅或跌幅的分钟,通常会在较短时间内出现幅度相当、方向相反的价格变动。我们将距离的讨论转化为概率矩阵:以5分钟为测试的周期,将涨跌幅由小 到大分成10组样本,并统计相邻时段出现极端涨跌幅的概率,结果如图4所示。图4:极端涨幅和极端跌幅的转换概率较高,说明在时间轴上的分布距离较近 数据来源:Wind、开源证券研究所 涨、跌幅时间重心反映了股价在日内交易中上涨和下跌的位置,此外还可以定义两个时间重心的差值和绝对差值,分别作为涨跌幅分布的“时间差”指标和“时间距离”指标,定义为�=𝐺�−𝐺�和�=|𝐺�−𝐺𝑢|。我们统计了涨跌幅时间重心,以及时间差的分布情况,如图5和图6所示。 图5:涨跌幅时间重心存在日间差异图6:“时间差”的分布:样本越少,差