AI智能总结
投资咨询从业资格号:Z0020121lihao8@gtht.com从业资格证号:F03136034songziyu@gtht.com 1 目录1.长短期记忆网络(LSTM)...................................................................................................................................................................32.特征筛选.....................................................................................................................................................................................................33.日频特征的单通道LSTM模型............................................................................................................................................................34.日频和日内特征的双通道LSTM模型..............................................................................................................................................45.回测与训练设置.......................................................................................................................................................................................56.回测检验.....................................................................................................................................................................................................67.结论.............................................................................................................................................................................................................10 请务必阅读正文之后的免责条款部分2 请务必阅读正文之后的免责条款部分(正文)1.长短期记忆网络(LSTM)在股指期货择时的任务中,由于预测目标为股指期货的价格走势,因此准确地捕捉和理解时间序列数据中的潜在规律至关重要。此外,随着股指期货市场的不断发展与复杂化,传统的线性量化模型在处理具有高度非线性、非平稳特性的股指期货时间序列数据时逐渐暴露出局限性。长短期记忆网络(Long Short-TermMemory, LSTM)模型作为一种特殊的循环神经网络(Recurrent Neural Network, RNN)架构,为解决此类问题提供了强大而有效的工具。LSTM模型通过的门控结构,包括输入门、遗忘门和输出门,能够有效地控制信息在记忆单元中的流动与更新。这样设计使得LSTM在处理具有长期依赖关系的时间序列数据时表现出色,可以避免传统RNN中出现的梯度消失或爆炸问题,从而能够对较长时间范围内的历史数据进行学习和建模,精准地把握数据中的趋势、季节性和周期性等特征。在股指期货择时应用场景下,市场行情数据通常呈现出复杂的时间序列特性,过去的走势对于预测未来价格变动有着重要的参考价值。这与LSTM所适用的问题解决方向不谋而合,LSTM能够充分挖掘股指期货历史量价信息等多维度数据中蕴含的潜在信息,学习到市场的内在运行规律。因此,基于现有的特征和因子,高效的使用LSTM进行股指上的择时,同时平衡过拟合的风险,是具有显著价值的。2.特征筛选在构建LSTM前,需要考虑的是所输出用于预测股指期货收益的特征。在本系列的前序报告中,我们针对四个股指期货品种从多角度构建了一系列日频的因子特征,包括持仓类、基差类、时间戳类等,既有使用日频信息构建的日频因子,也包含大量使用日内分钟频率信息构建的日频因子,特征的种类和信息来源都较为广泛。因此,在对LSTM进行构建和训练的过程中,本报告所使用的大部分特征均来源于过去累积的优秀因子特征。在具体的筛选逻辑上,对于每个股指期货品种,我们将特征分为三类:优秀日频特征、普通日频特征和分钟频特征。其中,优秀日频特征为已经经历过样本外验证的优秀日频特征(具体可参考前序系列报告),普通日频特征为过往累积的日频特征,分钟频率特征为基础分钟收盘价、开盘价、最高价、最低价以及成交量。优秀日频特征由于其已被验证的性能,可以经过滚动标准化处理后,直接作为日频特征输入LSTM中。对于普通日频特征,我们在对其进行滚动标准化处理后,计算其与预测目标的IC,排名前n的普通日频特征可以作为日频特征输入LSTM中。对于分钟频率的量价特征,我们将其视为与日频特征不同类型的特征,与日频特征有所区分的输入LSTM中,具体区分方式将在后文模型介绍中详细展开。3.日频特征的单通道LSTM模型为了有效的处理日频的特征,本研究首先设计了单通道LSTM模型专注于对日频特征序列进行建模(仅输入日频的特征),以提取日频时间序列数据中的长期依赖关系并预测股指期货收益。每个交易日的特征在LSTM层中依次通过三重门控机制:(1)遗忘门:根据当前输入和前一状态,决定丢弃细胞状态中的无关历史信息(例如20天前的成交量);(2)输入门:将新的特征与指标组合选择性存入细胞状态(如识别出净多头持仓量增加时强化该记忆);(3)输出门:控制当前隐藏状态的输出强度。这种门控机制使模型能动态调整记忆周期——对短期突发事件(如异常成交量)采用较短记忆,对长期趋势(如多头持仓增加与未来上涨的关系)保持较久记忆。在处理日频数据时,LSTM通过这些门控机制,能够有效地学习到过去多天内的特征信息如何影响当前的市场状态。 3 请务必阅读正文之后的免责条款部分4此外,为了防止过拟合,增加了Dropout层用于防止模型过拟合。在训练过程中,它随机丢弃一部分神经元的输出,迫使模型学习到更加鲁棒的特征表示。在本模型中,Dropout层的丢弃率为0.01,这意味着在训练时有1%的神经元输出会被随机丢弃。最后,输出层将LSTM层的输出映射到最终的预测值,即股指期货的预期收益。该层采用线性激活函数,输出一个连续的数值,表示模型对未来收益的预测。通过这种结构,LSTM模型能够有效地处理日频数据中的时间序列特性,捕捉到长期和短期的市场动态变化,从而为股指期货的收益预测提供准确的估计。图1:单通道LSTM模型结构资料来源:国泰君安期货研究4.日频和日内特征的双通道LSTM模型为了从广泛的维度捕捉收益和特征之间的动态变化关系,本研究设计了双通道LSTM模型,该模型同时处理日频和分钟频数据,以提取不同时间尺度上的特征信息并预测股指期货的日频收益。具体来说,在日频特征的处理上,保留了原有的单通道LSTM模型。同时,新增了一个类似的LSTM模型,输入为每日的分钟频率量价特征,这些特征也在其对应的LSTM层中经历与日频LSTM层类似的处理过程,捕捉日内高频交易中的短期波动特征和突发事件对收益的即时影响。分钟频LSTM层同样通过遗忘门、输入门和输出门来动态调整对短期信息的记忆和处理,从而提取出分钟频数据中的关键特征信息。在分别处理完日频和分钟频数据后,模型将两个LSTM模型的输出进行融合。具体来说,日频LSTM层的最后一个时间步的隐藏状态与分钟频LSTM层的最后一个时间步的隐藏状态被拼接在一起,形成一个综合的特征向量。这个综合特征向量包含了日频和分钟频数据中的关键信息,能够全面反映市场的长期趋势和短期波动情况。随后,这个综合特征向量通过一个全连接层进一步提取联合特征,并最终输出预测的股 请务必阅读正文之后的免责条款部分5指期货日频收益值。在整个过程中,分钟频的特征和日频的特征是独立生成各自的最后一个时间步的隐藏状态的。日频特征和分钟频特征分别通过各自的LSTM层进行处理,每个LSTM层独立地提取其输入特征序列中的时间序列信息,并生成各自的隐藏状态序列。最终,每个序列的最后一个时间步的隐藏状态被提取出来,用于后续的特征融合和预测。图2:双通道LSTM模型结构资料来源:国泰君安期货研究5.回测与训练设置在构建因子和测试因子效果的过程中,我们遵循传统因子择时中的基本逻辑,并进行了一系列的设置,本报告中有关因子构建和测试的具体细节如下:(1)确认目标变量:本篇报告目的为构建股指的日间择时策略,回测包含三个股指期货品种:上证50、沪深300、中证500股指期货,预测目标为其对应的收益率。在实际的交易过程中,我们希望能够使用收盘后的数据构建因子,第二天的开盘进行交易,因此在模拟回测的过程中,使用open toopen的收益率作为预测目标,以未来1日的收益率作为预测目标,构建日频的预测信号。(2)回测时间区间:2016年1月4日至2025年5月8日,共2300天左右条日频数据,和54万min左右的分钟数据。(3)调仓频率:日频调仓,若择时信号一直为多(空),则一直持有多单(空单)不平仓。(4)保证金100%,1倍杠杆。(5)手续费:双边万二。设定训练集为80%的数据集,测试集为20%的数据集,即2016年1月4日至2023年5月26日为训练集,2023年5月29日至2025年5月8日为测试集。在对模型进行训练的过程中,设定了训练的耐心值和早停机制,以确保模型既能够充分的遍历训练集上的信息,又避免出现过度学习和过拟合的情况。 请务必阅读正文之后的免责条款部分6.回测检验基于训练后的单通道LSTM模型和双通道LSTM模型所输出的预测值,我们进行了三个股指期货品种上的多空择时回测。此外,为了降低过拟合的风险,并提高交易的准确度,我们将LSTM的预测收益输入一层新的筛选层。当预测的收益值大于某个较大的阈值时,则认为未来open to open为正,反之,当预测的收益值小于某个较小的阈值时,则认为未来open to open为负,否则不交易。尽管这样的设计可能会导致交易相较之前更为稀疏,但是可以有效的降低过拟合的风险,显著提高了样本外的交易胜率。在本章 6 请务必阅读正文之后的免责条款部分中,展示了在三个股指期货品种上的回测净值情况。图3:IH单通道模型回测:全样本资料来源:国泰君安期货研究全样本:年化收益:25.70%夏普比率:1.92卡玛比率:1.39盈亏比:1.85最大回撤:-18.52%测试集:年化收益:1.76%夏普比率:0.11卡玛比率:0.12盈亏比:1.04最大回撤:-15.30%图5:IH双通道模型回测:全样本资料来源:国泰君安期货研究全样本:年化收益:25.86%夏普比率:2.40卡玛比率:4.38盈亏比:3.75最大回撤:-6.00%-0.5-0.45-0.4-0.35-0.3-0.25-0.2-0.15-0.1-0.05000.511.522.533.54