AI智能总结
优化债券择时系统的稳定性:多模型聚合策略 本报告导读: 本文重新构建了基于因子分组筛选与多模型聚合的的量价因子择时模型,并重点围绕有效性不稳定、信号波动大、单一信号可靠性不足三大问题展开优化。 孙越(分析师)021-38031033sunyue6@gtht.com登记编号S0880525080004 投资要点: 因势而动,精耕个券2025.11.28地产债韬晦待时2025.11.27再论股债同向:国债期货与权益市场关系进入新阶段2025.11.24存单利率何时“下得去”四个方面讲清楚2025.11.21博弈“名义变量”与“局部背离”2025.11.18 因子筛选:采用分组IC与阈值双重标准,破解有效性不稳定难题。在因子筛选环节,通过分组IC与阈值设定的双重标准,对因子在排序后的分组IC值进行穿透检验,并设定严格阈值,筛选出在高低值区间下均能稳定发挥预测作用的因子,从源头保障模型信息的有效性。 模型训练与信号生成:通过随机分组+投票聚合模型,实现噪声过滤与信号稳健性平衡。为破解单一因子噪声干扰,本文采用“随机分组+独立训练”的因子处理策略,将有效因子随机分组并独立训练子模型;信号生成环节通过“滚动平滑+多组投票”流程,对不同周期预测概率适配性平滑后以多数共识确定方向,既分散噪声又聚合有效信息,确保择时信号精准且稳健。最后,我们以2019年至2025年9月之间模型回测表现稳健性作为为核心依据,在筛选出不同预测目标对应的最佳参数,其中1日信号采用300日训练窗口、15组分组与每组15个因子,适配超短期噪声过滤需求;5日信号选择250日训练窗口、5组分组与每组10个因子,兼顾中期趋势捕捉与信号灵敏度;综合信号则以250日训练窗口、15组分组与每组20个因子为最优配置 回测来看,模型相较基准有明显提升,其中1日信号样本内外表现突出。样本内,1日信号年化收益3.61%、夏普1.12,全面领先基准;5日信号年化收益2.63%、综合信号2.20%,整体模型在收益、风险维度均跑赢基准。样本外,1日信号累计收益0.99%、相较基准优势明显,体现出较强的稳健择时能力,5日适应性则有所下降。 风险提示:历史数据存在失效的可能;模型核心参数依赖历史数据校准,易受样本区间结构性特征影响,量化模型效率可能衰减;极端行情波动。 目录 1.因子筛选:双重标准确定稳定性与有效性.............................................31.1.因子储备:量价因子+技术指标.......................................................31.2.筛选标准:兼顾稳定性与有效性.....................................................42.模型搭建与信号生成:基于随机分组和交叉验证的分组投票.................52.1.模型搭建:双向多层GRU +注意力机制........................................52.2.随机分组与信号生成:多模型投票聚合...........................................62.2.1.随机分组因子与并行训练:分散噪声........................................62.2.2.信号生成:多周期投票与平滑滤波的精准输出..........................63.策略回测设计与参数选择:兼顾稳健性与适配性..................................73.1.策略回测设计:多空全仓测策略.....................................................73.2.参数选择:兼顾稳健性与适配性的优化逻辑....................................73.3.回测表现:1日信号在样本内与样本外均表现突出..........................74.风险提示..............................................................................................9 受到有效性不稳定、多重共线性、高波动等多方面因素影响,以“分场景作战”的方式构建择时模型在2025年表现一般。我们重新构建了基于分组算法的量价因子择时模型,并重点围绕有效性不稳定、信号波动大、单一信号可靠性不足三大问题展开优化。在基于分组算法的量价因子择时模型中,我们既通过IC值筛选强化了因子的核心有效性,又借助随机训练与投票机制双重降低波动,同时提升模型信号的可靠性,相当于为量价择时策略打造“优质因子+稳定输出”的双支撑体系,更适配2025年以来复杂多变的市场环境。 资料来源:国泰海通证券研究 1.因子筛选:双重标准确定稳定性与有效性 量价因子凭借数据易获取、计算逻辑直观的优势,成为市场中应用最广泛的因子类型。但实际使用中,这类因子却普遍面临三重核心问题:一是高噪声干扰,量价数据包含大量无意义波动,因子难以精准区分;二是多重共线性隐患,多数量价因子源于价格或成交量的衍生计算,信息高度重叠,会导致模型误判因子重要性;三是有效性易随市场变化衰减,量价规律依赖特定市场环境,一旦市场结构改变,原本有效的“价涨量增”等逻辑可能失效,甚至因资金集中交易引发信号反向。 在此背景下,我们考虑通过分阶段处理的思路针对性应对,其中在因子筛选环节,重点解决有效性不稳定的问题,通过分组IC与阈值设定的双重标准,筛选出在不同取值范围内均能稳定发挥作用的因子,具体而言,先将因子值排序分组,若各组IC值方向一致且稳定,说明因子在高低值区间均具备持续预测能力,同时通过阈值设定确保因子有效性强度。对于多重共线性,则留待后续模型构建时进行处理。 1.1.因子储备:量价因子+技术指标 我们围绕国债期货量价特征,构建了涵盖日内形态、价格波动、成交量统计、趋势、动量、超买超卖等共计87个因子,全面覆盖日内结构、趋势方向、波动特征、量价联动等择时核心维度。 1.2.筛选标准:兼顾稳定性与有效性 为确保因子具备可靠的稳定性、有效性与时效性,我们采用年度滚动回测框架,每年以过去3年为数据窗口,对因子进行分组检验与筛选。具体来说, 首先将因子值排序后等距划分为5个分组;其次,设定双重条件,筛选出当年年度适用因子; 条件1:至少4组的IC保持方向一致性(同为正或同为负);条件2:同向IC的平均绝对值不低于0.05、。 通过该动态滚动的分组IC筛选机制,一方面能系统性识别出具有持续截面预测能力、跨分组稳定性优异的因子,确保入选因子在不同收益分段下呈现一致的影响方向与充足的影响强度;另一方面可及时适配市场环境变化,保障因子的时效性与适配性,为择时模型提供可靠的特征输入。 从2019年以来筛选结果来看,各因子被选出的次数呈多梯度分布,整体体现出不同因子在国债期货量价择时模型中预测能力的稳定性差异。 2.模型搭建与信号生成:基于随机分组和交叉验证的分组投票 2.1.模型搭建:双向多层GRU +注意力机制 本文模型以GRU(门控循环单元)+注意力机制的深度学习架构为核心,深 度 挖掘量价因子的时序关联与关键特征。模型设计上,采用双向多层GRU +注意力机制的组合,聚焦T+1日涨跌与T+5日涨跌两类短期择时需求,其中双向GRU捕捉因子的多向时序依赖,多层堆叠强化特征提取能力,注意力机制则聚焦对涨跌预测最关键的时间步与因子。为避免过拟合,引入Dropout与层归一化技术;训练环节采用“滚动窗口”模式,确保每一步验证都贴近“样本外”实战场景。该架构既发挥了GRU对时序数据的天然适配性,又通过注意力机制强化了核心信息的权重,为择时信号的精准性筑牢根基。 2.2.随机分组与信号生成:多模型投票聚合 资料来源:国泰海通证券研究 2.2.1.随机分组因子与并行训练:分散噪声 为破解单一因子噪声对模型的干扰,我们选择采取“随机分组+独立训练”的因子处理策略。 随机分组环节:在每年根据分组IC值筛选出有效因子后,将其随机划分为多组,每组包含若干独立因子,确保组间因子的独立性与多样性,避免单一因子逻辑过度主导,从源头分散噪声影响。 训练环节:对每组因子,我们单独训练一个GRU子模型,子模型的训练数据、参数初始化完全隔离,以此生成差异化的预测结果。这种设计的优势在于,让每个子模型从不同维度挖掘市场规律,为后续信号聚合提供丰 富的共识样本。 2.2.2.信号生成:多周期投票与平滑滤波的精准输出 模型的最终择时信号通过滚动平滑+多组投票的步骤生成,实现噪声过滤与有效信息提取的平衡,确保最终信号的精准性与稳健性。具体来说: ①滚动平滑:适配周期属性的噪声过滤。滚动平滑的核心目的是削弱量价因子易波动的特点对预测概率的干扰,同时根据不同预测周期的属性差异,匹配差异化窗口长度,平衡噪声过滤效果与信号时效性。对T+1、T+5分组预测概率,分别采用5日、3日滚动窗口平均进行平滑处理,其中T+5平滑窗口略短于T+1,主因其预测侧重短期偏中期趋势,市场噪声本身低于超短期,3日窗口既能过滤小幅波动噪声,又能保留趋势信号的灵敏性,防止过长窗口导致趋势响应滞后。 ②多组投票:在滚动平滑的基础上,通过多组投票机制确认单周期信号方向,进一步过滤单一子模型的预测误差。对平滑后的每组预测概率,以0.5为分界生成单组信号(看涨为1,看跌为-1);随后统计所有子模型的方向投票结果,若子模型加总信号大于0,则确定该周期的最终信号为1,子模型加总信号小于0,则确定该周期的最终信号为-1,若未形成多数共识则暂不输出有效信号,通过“群体智慧”降低单一子模型的随机误差影响。 ③ 此 外,我们还考虑为整合1d与5d的预测结果,生成综合信号。当1d_signal与5d_signal方向完全一致时(均为1或均为-1),取该一致方向作为聚合信号,确保信号同时具备短期时效性与中期趋势性;若两周期信 号方向分歧,则将聚合信号置0,避免矛盾信号导致的无效交易。 3.策略回测设计与参数选择:兼顾稳健性与适配性 参数设置是决定择时模型表现的关键环节,在此基础上,我们以回测表现稳健性作为为筛选参数的核心依据,在保证策略普适性的同时,最大化其在不同市场环境下的表现稳定性。 3.1.策略回测设计:多空全仓测策略 我们设置交易模式为多空全仓,即当最终信号为1,则满仓做多,为-1时,则满仓做空,为0时不调整仓位。此外,考虑参数设置环节的关键在于纯粹验证因子与信号的择时能力,因此我们剥离交易成本、滑点等次要因素的影响,以10年期国债期货主力合约收盘价为基准计算涨跌与收益。 3.2.参数选择:兼顾稳健性与适配性的优化逻辑 本文聚焦以下三大维度参数:训练窗口、分组数量与每组因子数量,具体来说: ①训练窗口:测试150日、200日、250日、300日等周期,匹配国债期货市场趋势变化节奏; ②分组数量:尝试5组/ 10组/ 15组/ 20组等规模,平衡多组投票的抗噪性与计算效率; ③每组因子数量:设置10个/ 15个/ 20个/ 25个等因子配置,既保证单组因子的信息维度充足,又防止因子过多造成的噪声叠加。 其后,我们基于不同参数组合,在2019年至2025年9月之间(覆盖国债期货市场成熟化进程及单边、震荡等各类行情,为模型有效性提供充分验证)进行模型训练与回测,并根据回测结果筛选出最佳参数,需要指出的是,为了减弱超参扰动,对于最佳参数的筛选规则摒弃“单一收益最大化”的片面标准,转而强调整体捕获收益能力较强的同时,在多数年份相对基准的稳定优势。 通过全网格遍历与多维度筛选,最终确定三类信号的最优参数组合: 1日信号采用300日训练窗口、15组分组与每组15个因子,适配超短期噪声过滤需求; 5日信号选择250日训