您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [东证期货]:国债期货量化系列(五):国债期货日内与隔夜趋势 - 发现报告

国债期货量化系列(五):国债期货日内与隔夜趋势

2023-06-28 王冬黎 东证期货 持之以恒
报告封面

深度报告-金融工程 国债期货量化系列(五): 国债期货日内与隔夜趋势 报告日期:2023年06月28日 ★主要内容 我们在前序报告中对国债期货择时因子池以及机器学习模型进行了初步探讨,国债期货日度周度具有显著的反转效应,此外我们对于机器学习策略跟踪过程中发现策略信号同样具有较强的反转效应。本文我们从日内的角度对国债期货的短期趋势策略进行补充研究,探讨因子有效性检验方法、因子实证分析以及组合策略构建等内容。 因子有效性检验方面,我们主要基于线性与非线性统计模型;同时参考交叉验证的思路,基于不同抽样方法计算因子有效性指标结果,以增强因子筛选的稳健性。 因子实证分析结果表明,日内策略与反转策略再不同品种上表现具有一定差异,十债期货日内动量效应较为显著,样本内头部因子样本外表现延续性高,抽样方法中时序分层、时序分层随机抽样法最为突出;隔夜动量效应整体也具有一定显著性,全部因子样本内与样本外因子值相关性较佳,样本内头部因子样本外并非特别突出,不同抽样方法样本外有效性差异不大。五债与两债期货实证结果相对十债有差异。 三大主要期货品种策略效果方面,十债期货日内策略表现较好、隔夜动量表现稍弱,而五年与两年期国债期货日内动量策略表现较弱、隔夜动量策略表现较好。我们对日内动量与隔夜动量策略进行进一步合成,即每日开盘前与收盘前均具有交易信号,得到组合策略效果得到进一步提升,基于2019年之间的样本外拼接净值分析测算,组合策略夏普率1.96,年化收益率6.4%,最大回撤2.0%,日内与隔夜策略实现较好的风险对冲效果,显著提升组合策略收益风险比。 ★风险提示 量化模型有效性基于历史数据得出,不排除失效的可能。 王冬黎金融工程首席分析师 从业资格号:F3032817 投资咨询号:Z0014348 Tel:8621-63325888-3975 Email:dongli.wang@orientfutures.com 金融工程 重要事项:本报告版权归上海东证期货有限公司所有。未获得东证期货书面授权,任何人不得对本报告进行任何形式的发布、复制。本报告的信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成交易建议,投资者据此做出的任何投资决策与本公司和作者无关。 有关分析师承诺,见本报告最后部分。并请阅读报告最后一页的免责声明。 目录 1.主要思路框架5 2.因子有效性检验5 2.1.因子有效性的统计检验方法5 2.2.因子有效性测算的交叉验证6 3.因子实证分析7 3.1.指标处理与策略构建7 3.2.因子样本内外RankIC表现8 3.2.1.日内策略8 3.2.2.隔夜策略11 3.3.分年度因子IC情况15 3.4.不同波动率下的因子有效性16 4.策略效果实证分析18 4.1.策略构建说明18 4.2.不同因子有效性检验方法策略效果分析18 4.3.不同品种策略表现与策略组合结果21 5.风险提示24 2期货研究报告 图表目录 图表1:因子有效性的统计检验方法介绍6 图表2:因子有效性测算的交叉验证方法(训练集有效性判定)6 图表3:指标处理与策略构建基本处理说明7 图表4:日内策略样本内因子RankIC(全样本筛选)8 图表5:日内策略样本外因子RankIC(全样本筛选)8 图表6:日内策略样本内因子RankIC(随机抽样筛选)9 图表7:日内策略样本外因子RankIC(随机抽样筛选)9 图表8:日内策略样本内因子RankIC(时序分层筛选)9 图表9:日内策略样本外因子RankIC(时序分层筛选)9 图表10:日内策略样本内因子RankIC(波动率分层筛选)10 图表11:日内策略样本外因子RankIC(波动率分层筛选)10 图表12:日内策略样本内因子RankIC(时序分层随机抽样筛选)10 图表13:日内策略样本外因子RankIC(时序分层随机抽样筛选)10 图表14:日内策略全部因子因子值样本内外回归R211 图表15:日内策略样本内前五因子不同窗口样本外与样本内因子值之比11 图表16:隔夜策略样本内因子RankIC(全样本筛选)12 图表17:隔夜策略样本外因子RankIC(全样本筛选)12 图表18:隔夜策略样本内因子RankIC(随机抽样筛选)12 图表19:隔夜策略样本外因子RankIC(随机抽样筛选)12 图表20:隔夜策略样本内因子RankIC(时序分层筛选)13 图表21:隔夜策略样本外因子RankIC(时序分层筛选)13 图表22:隔夜策略样本内因子RankIC(波动率分层筛选)13 图表23:隔夜策略样本外因子RankIC(波动率分层筛选)13 图表24:隔夜策略样本内因子RankIC(时序分层随机抽样筛选)14 图表25:隔夜策略样本外因子RankIC(时序分层随机抽样筛选)14 图表26:隔夜策略全部因子因子值样本内外回归R214 图表27:隔夜策略样本内前五因子样本外与样本内因子值之比15 图表28:日内策略分年度因子ICIR情况15 图表29:日内策略分年度因子IC为正占比15 图表30:隔夜策略分年度因子ICIR情况16 图表31:隔夜策略分年度因子IC为正占比16 图表32:日内策略全部因子不同波动率分组下因子值样本内外回归R217 图表33:日内策略样本内前五因子不同窗口与波动率分组下样本外与样本内因子值之比17 图表34:隔夜策略全部因子不同波动率分组下因子值样本内外回归R217 图表35:隔夜策略样本内前五因子不同窗口与波动率分组下样本外与样本内因子值之比18 图表36:策略构建说明18 图表37:日内策略不同因子有效性检验方法样本外净值分析汇总19 图表38:隔夜策略不同因子有效性检验方法样本外净值分析汇总20 图表39:日内动量策略分品种表现21 图表40:日内动量策略分品种表现21 图表41:隔夜动量策略分品种表现22 图表42:隔夜动量策略分品种表现22 图表43:日内动量策略全品种组合净值表现22 图表44:隔夜动量策略全品种组合净值表现23 图表45:日内动量与隔夜动量策略等权全品种组合净值表现23 1.主要思路框架 我们在前序报告中对国债期货择时因子池以及机器学习模型进行了初步探讨,我们基于国债期货时序特征研究指出国债期货日度和周度具有显著的反转效应,对于传统的基差量价等因子与国债期货价格变化率的预测回归也充分体现这一特性,此外我们对于机器学习策略跟踪过程中发现策略信号同样具有较强的反转交易的特性,其偏向于震荡市中表现更好而趋势较大或突发事件影响下表现较差。从宏观角度来看国债期货的反转效应或许印证了熨平波动的利率调控目标,交易反转可能具有一定的逻辑支撑,但反转效应类似卖出跨式期权,可能胜率较高但一定是暴露尾部风险的,因而我们从日内的角度对国债期货的短期趋势策略进行补充研究,探讨因子有效性检验方法、因子实证分析以及组合策略构建等内容。 2.因子有效性检验 因子有效性检验是进行单因子筛选的首要步骤,我们的目的在于通过比较不同的统计检验与抽样方法的样本外效果,寻找更为稳健的单因子筛选方法,进而提升样本外策略表现。因子有效性检验的方法我们主要基于线性与非线性统计模型,同时评估因子预测能力的方向与强弱;同时我们参考交叉验证的思路,在因子有效性判断的过程中加入不同抽样方法,通过训练集不同子样本的综合统计结果增强因子有效性评价的稳健性。 2.1.因子有效性的统计检验方法 我们采用的因子有效性的统计检验方法主要有时序IC、时序RankIC、回归解释能力、互信息解释能力四种。时序IC的计算我们以时间维度为样本空间,计算上一期因子值与下一期价格变化率之间的信息系数,用于衡量因子的收益预测能力。时序RankIC与IC的区别在与前者将具体的因子值与收益率值转换成排名,用排名代替原值可减弱因子异常值的影响。回归解释能力指标即OLS回归R2,是因子对因变量y可解释的方差与总方差之比,用于衡量因子解释能力强弱,若特指趋势信号需与IC符号或回归系数符号结合使用。互信息解释能力基于信息论框架,是一种非线性解释能力的度量,互信息基于熵的概念构建(熵是一个随机变量不确定性的度量,一个随机变量的熵越大,意味着不确定性越大,那么该随机变量包含的信息量越大),而互信息解释能力量化了通过观察一个随机变量获得的关于另一个随机变量的信息量(熵缩小的程度)。互信息解释能力指标同样无方向性判断,需与IC符号或回归系数符号共同判断动量效应指标筛选。 图表1:因子有效性的统计检验方法介绍 时序IC 时序RankIC 回归解释能力 互信息解释能力 方法涵义 时序IC的计算方法为计算全部样本因子值与下一期收益率的线性相关度。 时序RankIC计算全部时间样本上因子排名与收益率排名的相关系数。 基于OLS线性回归,获取回归解释能力指标R2,判断因子有效性强弱。 互信息基于非线性框架,量化了通过观察一个随机变量获得的关于另一个随机变量的“信息量”。 指标筛选 选择IC为正的指标;选择IC值最高的前N个指标。 选择RankIC为正的指标;选择RankIC值最高的前N个指标。 选择IC为正的指标;再选择回归R2值最高的前N个指标。 选择IC为正的指标;再选择互信息R2值最高的前N个指标。 资料来源:东证衍生品研究院 2.2.因子有效性测算的交叉验证 金融时间序列预测研究易受到样本量有限的影响得到过拟合的结论,我们尝试在训练集因子筛选部分加入基于不同抽样方法的交叉验证加强样本内因子有效性度量的稳健性。具体而言,我们基于五种不同的抽样方法进行,首先全样本是最常规的做法,即基于训练集全部样本计算因子有效性统计指标,基于指标结果选择有效因子进行样本外策略跟踪;其次是随机抽样,我们对训练集全样本进行100次20%样本量的随机抽样,计算在这100个样本上因子有效性指标的均值,基于该均值结果进行指标筛选。然后我们同时考虑在样本划分中引入时序分层,参考机器学习模型训练中优化超参数常用的K折交叉验证的方法,我们将训练集全部样本等分为20组,计算因子有效性统计指标分组均值。此外我们进一步对于时序分层加入随机抽样具体做法与全样本随机抽样类似,在对各分组进行100次20%样本的随机抽样,计算因子有效性统计指标在全部分组样本中的均值。最后,我们对基于历史波动率对训练集进行分组,具体而言即将基于收盘价计算的滚动20日波动率分位数等分为20组计算因子有效性统计指标在全部分组样本中的均值。 图表2:因子有效性测算的交叉验证方法(训练集有效性判定) 方法 具体操作介绍 全样本 基于训练集全部样本计算因子有效性统计指标。 随机抽样 基于训练集全样本进行100次20%样本的随机抽样,计算因子有效性统计指标抽样样本均值。 时序分层 基于训练集全样本按时序等分为20组(KFold),计算因子有效性统计指标在各个组样本均值。 时序分层随机抽样 先对训练集全样本进行20组时序分组,在对各分组进行100次20%样本的随机抽样,计算因子有效性统计指标在全部分组样本中的均值。 波动率分层 将训练集按历史波动率(基于收盘价计算滚动20日波动率)分位数等分为20组计算因子有效性统计指标在全部分组样本中的均值。 资料来源:Wind,东证衍生品研究院 除因子有效性测算交叉验证外,我们也基于波动率分层的方法对不同历史波动率环境下,具体而言基于收盘价滚动20日历史波动率划分低波动率、中波动率、高波动率三组,筛选出的有效因子样本外表现进行简要分析,结论发现对于隔夜动量策略,基于高波动率历史区间筛选得到的因子样本外表现更为稳健。 3.因子实证分析 3.1.指标处理与策略构建 本部分我们基于前文因子有效性检验的方法论以十年期国债期货为例进行实证分析。首先我们的考察的策略框架分别为日内趋势策略与隔夜趋势策略,日内策略即日内开平仓不留隔夜敞口的短线趋势策略,隔夜策略于收盘前建仓次日开盘平仓,即只