您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:国债期货系列报告:多通道深度学习模型在国债期货因子择时上的应用 - 发现报告

国债期货系列报告:多通道深度学习模型在国债期货因子择时上的应用

2025-08-28国泰君安证券话***
AI智能总结
查看更多
国债期货系列报告:多通道深度学习模型在国债期货因子择时上的应用

国债期货系列报告:多通道深度学习模型在国债期货因子择时上的应用 投资咨询从业资格号:Z0002804 虞堪 yukan@gtht.com 宋子钰(联系人)从业资格证号:F03136034 songziyu@gtht.com 报告导读: 本报告直面传统量化因子在当前债市震荡行情中普遍性能下降的核心痛点,创新性地提出了融合日频与分钟频数据的深度学习双通道模型(LSTM和GRU)。实证研究表明,该模型能有效捕捉不同时间尺度的市场信息,显著提升策略在样本外(尤其是市场下行期)的预测准确性与稳定性,为重构债市量化择时体系提供了具有强泛化能力的新思路。 在模型的使用上,主要使用了RNN、LSTM、GRU三种适用于时序预测的深度学习模型,重点阐述了LSTM/GRU通过门控机制解决长程依赖问题的优势。在传统深度学习模型设计的基础上,突破单一频率输入的局限,设计使用了双通道模型架构。研究发现,深度学习方法在国债期货日频择时上可能会存在较大的过拟合风险,但是在加入分钟频信息后,模型的性能尤其是样本外能力得到了有效的提升。其中日频通道用于捕捉过去20个交易日的长期趋势和宏观基本面信息,分钟频通道用于解析前一日日内高频量价数据中的微观模式和即时信息。最终,双流信息融合,共同决策,实现了对市场“长期趋势”与“短期波动”的协同感知。 通道模型在样本外测试中表现显著优于单一日频模型,年化收益、夏普比率稳定,展现了卓越的泛化能力和鲁棒性。此外,模型在空头行情中仍能维持较高胜率,有效弥补了传统因子在市场下行时失效的短板,为策略提供了显著的双向预测能力。 目录 1.深度学习模型介绍...................................................................................................................................................................................31.1循环神经网络(RNN)..............................................................................................................................................................31.2长短期记忆网络(LSTM)........................................................................................................................................................41.3门控循环单元(GRU)..............................................................................................................................................................51.4双通道模型.....................................................................................................................................................................................62.国债期货择时检验...................................................................................................................................................................................72.1回测设置..........................................................................................................................................................................................72.2日频通道模型................................................................................................................................................................................72.3双通道模型.....................................................................................................................................................................................93.多因子框架中的深度学习配比..........................................................................................................................................................124.结论.............................................................................................................................................................................................................12 (正文) 1.深度学习模型介绍 多因子模型是国债期货量化择时,甚至是量化择时中最为重要的方法之一。因子的质量,参数的调节,以及交易方式的选择等方面是量化模型能够表现优秀的重要条件。由于债市与宏观和基本面的信息联系较为密切,相关程度较高,因此在传统的量化债市量化择时体系中,对于因子的可解释性要求较高。换而言之,构造相对较为简单,逻辑较为清晰的因子,在债市量化中是更为常见和常用的。然而,随着市场参与者的日渐复杂以及数据量的不断扩充,加之债市整体逻辑的转变,传统的因子挖掘体系可能难以覆盖足够有价值的信息。根据我们的跟踪与测试,大量传统的基本面因子或量价因子虽然在16年到22年表现较为优秀,但是在近几年,尤其是进入2025年后,出现了集体失效的现象。这其中的原因既与债市从牛到熊的逻辑转变有关,也有因子本身的质量和过去的挖掘方式有关。因此,在目前的背景下,如何通过更为有效的方式,对于债市量化因子进行重构和重新挖掘,是问题的关键。 随着机器学习技术和深度学习技术的发展,叠加海量数据的增广,我们可以通过数据驱动的角度,可持续的对信息进行聚合,从高频的量价数据和多角度的基本面、宏观数据中,寻找数据之间的复杂关系(线性和非线性)。这样的方法既可以从量化的角度,对传统的因子挖掘体系进行补充的增强,也可以为主观决策提供模型上的信息补足。由于在国债期货的因子择时过程中,大部分任务或者大部分目标场景是对于时序上的走势进行准确的预测,因此模型需要具有对历史走势和数据进行考虑的能力。基于这类任务特点,本报告将由浅入深,从循环神经网络(RNN)出发,逐步将模型推广至门控循环单元(GRU)和长短期记忆网络(LSTM),检验此类深度学习方法对国债期货的择时任务上的效果。以上的三种方法,均能够考虑到时间序列中的长期依赖关系,因此我们推测在国债期货的量化择时中,能够取得较好的效果。 1.1循环神经网络(RNN) 在传统的前馈神经网络(Feedforward Neural Network)中,信息只能从输入层单向传递到输出层,网络本身没有“记忆”功能。这意味着其处理每一个输入样本时都是独立的,无法利用样本之间的序列上下文信息。为了处理具有明显前后关系的时间序列序列数据,循环神经网络(RNN)应运而生。其核心思想是:让网络具备“记忆”能力,能够将之前处理过的信息保留下来,并用于影响当前输出的计算。这是通过在其网络结构中引入“循环” (Recurrent)连接来实现的。 尽管RNN能够处理时间序列数据,将历史信息进行记忆,捕捉时间序列上的动态特征。但是,当需要处理的时间序列较长时,会出现梯度消失的问题,从而导致模型的训练不稳定甚至无法学习到长距离的依赖关系。根本原因是,在通过时间反向传播(BPTT)时,梯度需要沿着时间步连续相乘。当序列很长时,如果梯度值小于1,连续相乘会使其指数级减小到接近0,导致模型无法学习到长距离的依赖关系。 以下为基础的RNN的结构与设计: 其中t表示时间步,𝑥𝑡表示第t个时间步的输入,ℎ𝑡表示第t个时间步的隐藏状态,𝑦𝑡表示第t步的输出向量,U、W、V均为可学习的权重矩阵,𝑏ℎ和𝑏𝑦为可学习的偏置向量,此处的tanh表示激活函数。其前向传播形式如图所示,此处为了展示的简洁,省略了权重矩阵和偏置向量。 资料来源:国泰君安期货研究 1.2长短期记忆网络(LSTM) 正如前文所述,简单RNN由于梯度消失或梯度爆炸的问题,无法有效学习序列中的长程依赖关系。而长短期记忆网络(LSTM)的提出,其核心设计目标就是直接解决梯度消失问题,让网络能够学会何时“记住”长期信息,何时“忘记”无关信息,从而在长序列中也能有效地传递信息。LSTM通过两个关键设计实现其目标:一个细胞状态(Cell State)和三个门控单元(Gates),其中门控单元包括包括输入门、遗忘门和输出门,能够有效地控制信息在记忆单元中的流动与更新。而细胞状态贯穿了整个链式结构,新的细胞状态是由旧的细胞状态经过遗忘门和输入门进行调控,且信息在细胞状态路径上的传播主要包含线性操作,从而避免了梯度消失的问题。 以下为LSTM的结构与设计,按照信息的前向传播顺序排列: 遗忘门:𝑓𝑡=σ(𝑊𝑓[ℎ𝑡−1,𝑥𝑡]+𝑏𝑓)决定上一时间的记忆细胞在当前应该忘记多少 输入门:𝑖𝑡=𝜎(𝑊𝑖[ℎ𝑡−1,𝑥𝑡]+𝑏𝑖)决定当前时间的新信息有多少需要写入记忆 候选记忆:𝑐̃𝑡=𝑡𝑎𝑛ℎ(𝑊𝑐[ℎ𝑡−1,𝑥𝑡]+𝑏𝑐)在当前时间步获得的新信息 细胞状态更新:𝑐𝑡=𝑓𝑡∗𝑐𝑡−1+𝑖𝑡∗𝑐̃𝑡使用遗忘门和输入门,结合上一步的记忆以及本步的新信息,完成当前时间点的信息归档 输出门:𝑜𝑡=σ(𝑊𝑜[ℎ𝑡−1,𝑥𝑡]+𝑏𝑜)决定当前的记忆细胞有多少会暴露为当前的隐藏状态 隐藏状态:ℎ𝑡=𝑜𝑡∗tanh(𝑐𝑡)在本时间点留下的记忆,将会传入下一个时间点 结果输出:𝑦𝑡=𝑉ℎ𝑡+𝑏𝑦将隐藏状态映射到最终的任务结果,在收益预测的任务中,可以映射为涨、跌、平的1、-1、0信号,或者根据需求预测具体的收益连续数值。 其中t表示时间步,𝑥𝑡表示t时间点的输入向量,ℎ𝑡−1表示上一个时间步的隐藏状态,𝑐𝑡表示记忆细胞, 𝑓𝑡、𝑖𝑡、𝑜𝑡分别表示遗忘门、输入门和输出门,𝑐̃𝑡表示候选