您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[太平洋证券]:基于NARX动态神经网络的指数择时策略 - 发现报告

基于NARX动态神经网络的指数择时策略

2025-09-12刘晓锋、马自妍太平洋证券F***
AI智能总结
查看更多
基于NARX动态神经网络的指数择时策略

金融工程|深度研究报告 AI投研应用系列之三: 基于NARX动态神经网络的指数择时策略 马自妍S1190519070001证券分析师:分析师登记编号:刘晓锋S1190522090001证券分析师:分析师登记编号: 目录 1.时序神经网络概述2.NARX神经网络模型3.基于NARX模型的指数择时策略构建4.宽基指数择时测试5.总结与未来研究方向 1、时序神经网络概述 1.1时序神经网络的演进与主要模型 在金融时间序列预测领域,神经网络架构经历了从简单感知向复杂时序建模的重要演进。 早期循环神经网络(RNN)首次引入隐状态记忆机制,但存在梯度消失/爆炸问题,难以捕获长期依赖。随后长短期记忆网络(LSTM)及其变体门控循环单元(GRU)通过门控设计较好地解决了长期依赖问题,成为多年来的主流时序建模方案。近年来,时序卷积网络(TCN)依托因果膨胀卷积结构实现了更高效的并行计算与长期依赖建模;而源于自然语言处理的Transformer模型,也凭借自注意力机制在长序列预测中展现出显著潜力。 在此背景下,带外部输入的非线性自回归网络(NARX)以其独特的结构设计和良好的可解释性,为多变量金融时间序列预测提供了一个直观而有力的工具。 目录 1.时序神经网络概述2.NARX神经网络模型3.基于NARX模型的指数择时策略构建4.宽基指数择时测试5.总结与未来研究方向 2、NARX神经网络模型 2.1 NARX模型原理 NARX(Nonlinear Auto-Regressive Models with Exogenous Inputs)即带外部输入变量的非线性自回归神经网络,是一种专门为多变量时间序列预测设计的动态递归神经网络。 其核心思想直观且符合金融逻辑:未来的值不仅取决于自身过去的历史,还受到一系列外部驱动因素的滞后影响。NARX模型将这一思想数学化,通过非线性函数来学习这种复杂的映射关系。其表达式为: •𝑥为输入的时间序列,即外部输入变量,可以由多个指标构成。 •𝑦为输出的时间序列。•𝑑𝑥为输入变量的滞后阶数。•𝑑𝑦为输出变量的滞后阶数。 2、NARX神经网络模型 2.2 NARX模型结构 模型结构主要由四个层级构成: •输入层:接收外部多维信号;•时延层:通过延迟模块处理外部输入和输出反馈信号,生成具有特定滞后的历史数据序列,以提供时序记忆;•隐含层:用非线性激活函数对这些时序信号进行高阶特征提取与复杂映射;•输出层:通过线性加权产生预测值,该值同时反馈回时延层,形成闭环信息流。 资料来源:太平洋证券整理 2、NARX神经网络模型 2.3训练架构 NARX具有开环和闭环两种架构。在训练阶段,采用开环架构,反馈信号来自训练集的真实历史值,避免了误差在训练过程中的累积与传播,提升训练过程的稳定性和收敛速度,使得模型能够高效地学习到输入与输出之间的真实映射关系。在预测阶段,切换至闭环架构,模型将自身前一步的预测值反馈回来,作为下一步预测的输入,这使得模型能够进行真正的多步预测。 资料来源:太平洋证券整理 资料来源:太平洋证券整理 2、NARX神经网络模型 2.4 NARX模型的优势 ➢模型直观,结构可解释性强:NARX的网络结构是对经典线性ARX(Autoregressive withExogenous inputs)模型的非线性扩展。输入层被明确划分为自回归(AR)和外生输入(X)两部分,使模型架构本身就承载了计量经济学模型的先验知识,可解释性更强,与黑盒模型相比融入了白盒特征。 ➢分离式输入结构提供可控的分析框架:其结构原生区分目标序列历史值与外部驱动因子,可以独立调控自回归部分与外生部分的滞后阶数、网络复杂度(如为其设计不同的子网络路径),并通过权重来量化不同变量的相对重要性。这种对模型行为的可控性和可验证性,是端到端黑盒模型所缺乏的。 ➢训练高效且稳定:开环训练模式用真实值进行反馈,有两个优势。第一,前馈网络的输入更准确。第二,生成的网络为纯前馈架构,可以使用静态反向传播进行训练,规避了LSTM、GRU等模型所依赖的随时间反向传播(BPTT)及其固有的梯度问题(消失/爆炸)。这使训练过程的内在稳定性更高,收敛曲线更平滑,对超参数调优的敏感度显著降低。 ➢数据量需求小,效率更高:通过网络结构内置了“未来状态依赖于其自身及外生输入的历史状态”的强归纳偏置(Inductive Bias),与大多数金融时间序列的逻辑相符。因此,相比于参数更多、偏置更灵活(如Transformer的全局依赖性、LSTM的选择性记忆)的模型,NARX从数据中学习未知规律的需求更小,使其在中等规模数据集上能更快收敛,展现出更优的泛化性能且更不容易过拟合。 2、NARX神经网络模型 2.5 NARX和其他模型的对比 NARX在结构性可解释性、训练稳定性和数据效率方面具有优势,而LSTM、TCN和Transformer则在处理更复杂的长期依赖和海量数据场景下各有优势。以下表格对比了各模型的差异: 目录 1.时序神经网络概述2.NARX神经网络模型3.基于NARX模型的指数择时策略构建4.宽基指数择时测试5.总结与未来研究方向 3、基于NARX模型的指数择时策略构建 3.1指数走势拐点预测 在指数择时模型的构建中,相比于直接预测指数价格,更具有实际意义的是可以预测出当前是否处于阶段的顶部或底部,即识别出指数走势的拐点。 当指数形成阶段的顶点或底点时,其最近一段时间的价格、成交量、资金流等往往具有一定的特征。指数走势在往期多种因素的共同非线性影响下形成,因此可以用神经网络对这种非线性映射关系进行建模。 指数走势状态划分:将指数走势的模式划分为转折点和持续点两种状态。 以7日为一个基本区间,定义在该区间范围内, •若当日最高价处于之前3个及之后3个交易日最高价的最高点,则该交易日为局部顶点,属于转折点;•若当日最低价处于之前3个及之后3个交易日最低价的最低点,则该交易日为局部底点,属于转折点。•其余交易日则属于上涨或下跌中的持续点。 3、基于NARX模型的指数择时策略构建 3.2输入输出设定 •输入指标应精简高效,避免冗余,模型选择了价格、量能、波动性、拥挤度、资金流这几个方面的8个代表指标,并用极差标准化对数据进行归一化处理将数据映射到(0,1)之间: •输出:真实值的转折点或持续点,以1或者0标记;神经网络输出是介于0,1之间的数值,当输出值有增大趋势的时候,是转折点的概率上升,输出值有减小趋势的时候,是持续点的概率上升。 3、基于NARX模型的指数择时策略构建 3.3择时框架设定 •择时标的:沪深300、中证500、中证1000 •数据区间:2016.01.01-2025.09.03,其中从2016-2022年中划分出训练集和验证集用于模型训练,2023-2025年数据用于预测。 3、基于NARX模型的指数择时策略构建 3.3择时框架设定 择时策略 •当输出大于输出序列的M日均线时,识别为转折点,否则为持续点。•如果模式识别模式为转折点,且处于之前三个交易日的最低点,则判断后续走势向上,入场做多;•如果模式识别模式为转折点,且处于之前三个交易日的最高点,则判断后续走势向下,入场做空;•持仓期间产生信号,在执行新信号的同时,平仓上次信号。•发生信号以第二天的开盘价开仓,平仓日的收盘价平仓,单次信号持有时间设置为N个交易日,设置10%止损。•先训练好模型,后期再对均线天数和持有天数优化。 3、基于NARX模型的指数择时策略构建 3.4信号准确率评价 •准确率评价 评价指标主要为以下几个:综合准确率,为预测模式和实际模式相一致的结果所占的百分比;有效识别率,为实际模式为转折点的全部数据中,预测模式准确预测为转折点所占的百分比;识别准确率,为预测模式为转折点的全部数据中,实际模式确实为转折点所占的百分比。 综合准确率=(实际转折、预测转折点数+实际持续、预测持续点数)/全部预测点数有效识别率=实际转折、预测转折点数/(实际转折、预测转折点数+实际转折、预测持续点数)识别准确率=实际转折、预测转折点数/(实际转折、预测转折点数+实际持续、预测转折点数) 3、基于NARX模型的指数择时策略构建 3.4信号准确率评价 •调整准确率评价 由预测结果观察可知模型对阶段顶部和底部有比较好的识别,即使有些不在拐点当天,也仅与拐点相差一两个交易日,或者与真实最高最低点仅有微小幅度的差异,因而相比于严格计算的准确率,实际择时效果会更好。因此可以适当放松准确率的评价方式,会更接近实际对顶底部的识别效果。 若与实际顶底点相差仅1个交易日,且与最高最低点实际相差幅度0.05%以内,也判定识别准确。可按此方式计算调整后的准确率。 目录 1.时序神经网络概述2.NARX神经网络模型3.基于NARX模型的指数择时策略构建4.宽基指数择时测试5.总结与未来研究方向 4、宽基指数择时测试 4.1沪深300择时模型净值与绩效 资料来源:Wind,太平洋证券 4、宽基指数择时测试 4.2沪深300择时信号准确率 分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 4、宽基指数择时测试 4.3沪深300择时模型信号 沪深300择时最近一年的多空信号标记如下。 资料来源:Wind,太平洋证券 4、宽基指数择时测试 4.4中证500择时模型净值与绩效 资料来源:Wind,太平洋证券 4、宽基指数择时测试 4.5中证500择时信号准确率 分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 4、宽基指数择时测试 4.6中证500择时模型信号 中证500择时最近一年的多空信号标记如下。 资料来源:Wind,太平洋证券 4、宽基指数择时测试 4.7中证1000择时模型净值与绩效 资料来源:Wind,太平洋证券 4、宽基指数择时测试 4.8中证1000择时信号准确率 分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 4、宽基指数择时测试 4.9中证1000择时模型信号 中证1000择时最近一年的多空信号标记如下。 资料来源:Wind,太平洋证券 目录 1.时序神经网络概述2.NARX神经网络模型3.基于NARX模型的指数择时策略构建4.宽基指数择时测试5.总结与未来研究方向 5、总结与未来研究方向 本报告探讨了NARX动态神经网络在指数择时中的应用。通过价格、量能、波动性等多维度特征,采用开环-闭环训练模式,构建了一个时序预测框架。回测结果表明,该模型对指数阶段性顶底部具有良好的识别能力。 NARX模型的核心优势在于其“白盒”结构,通过显式分离自回归项与外生输入,既保持了神