如何搭建一个能感知环境+共振决策的利率择时模型 ——债市量化系列之七 本报告导读: 利用L1攻防双轨概率预测+ GMM市场状态感知/共振决策矩阵,让利率择时模型随市场环境自动优化。 孙越(分析师)021-38031033sunyue6@gtht.com登记编号S0880525080004 投资要点: 极致分化后的再平衡2026.06.01如何筛选负久期债基:久期稳定性和对冲效果2026.05.31参与“抱团”的正确姿势2026.05.30用负久期债基搭建一个低回撤组合:方案设计和对冲效果2026.05.26现实的“资金拐点”可能是怎样的:三个细节2026.05.24 首先在因子构造与筛选环节,我们将原始机构行为数据重构为趋势、极值、敏感度三大类衍生特征,并针对性的筛选出进攻因子库与防守因子库。一方面,本文通过多维非线性变换构建了包含1429个特征的机构行为衍生因子库,趋势类捕捉机构资金边际交易意愿的“二阶导”变化与平稳性,敏感度进一步为机构行为博弈行为打上,极值类精准识别微观交易结构中的“极度拥挤”与“均值回归”拐点;另一方面,本文突破了传统单向筛选的局限,根据因子的多空收益特征将其划分为“进攻库”与“防守库”:进攻因子专注在多头状态下获取利润,防守因子则针对尾部风险进行预警。 其次在信号层,本文对预测目标进行了重构,构建了相互独立的L1双轨正则化预测模型。模型分别针对进攻库与防守库训练了互不干扰的L1逻辑回归引擎:进攻模型不再旨在寻找预期收益足以覆盖资金成本的顺势机会;防守模型则针对实质性的大跌样本进行权重平衡训练,专注充当尾部危机的预警器,强化了模型在非对称债市环境下的应对能力。 最后,考虑到是实际中不存在能够穿越所有周期的“完美模型”或“万能因子”构建模型对“市场环境的动态识别与适配”能力,才是实现策略长期稳健盈利的核心胜负手。我们针对机构行为因子状态适配特征,引入了GMM模型并设置了基于久期、杠杆率、波动率的环境感知机制,进而构建了最终的仓位决策矩阵。在以L1进攻子模型作为基础信号前提下,进一步引入GMM状态机,通过久期与杠杆率将市场划分为6元正交状态,在顺风期动态放大杠杆,在拥挤且波动放大的时期则主动收缩杠杆,最后辅以防守模型的前置“一票否决”机制。这套机制使得系统不仅依赖胜率预测,更能基于市场环境的不确定性主动进行风险阻断。 从实战回测表现来看,这套适配机构行为的复合模型在各个年度均表现出了较强的择时能力与稳健性,其中GMM状态机也展现出较为有效的的择时Alpha贡献。回测来看,在2021年至2026年间,7-10Y与10+的周度策略分别斩获了9.03%和17.73%的年化收益,同时将最大回撤明显压缩,其中GMM状态机也贡献出了的真实择时Alpha。此外,本文还补充了针对因子筛选环节的稳健性检验,结果显示对该模型机构具有较强的时序连贯性。 风险提示:历史数据存在失效的可能;模型核心参数依赖历史数据校准,易受样本区间结构性特征影响,极端行情波动 目录 1.研究思路:从特征重构到L1-GMM复合择时模型.................................32.因子重构与筛选...................................................................................32.1.特征工程:机构行为的衍生构造.....................................................32.2.因子初筛:从海量特征到“进攻-防守”双轨因子库............................43.模型构建:基于涨跌幅度的“进攻-防守”L1双轨预测模型....................64.加入市场状态识别:GMM状态机与仓位决策矩阵...............................74.1.市场环境的动态适配:基于GMM与波动率的双重感知....................74.2.仓位决策:将环境适配的共振矩阵引入进攻×防守子模型................85.策略回测与归因分析............................................................................95.1.回测环境与核心参数设定................................................................95.2.综合模型回测表现:周度调仓强于日度调仓....................................95.3.GMM状态机归因:择时Alpha与跨期稳定性...............................115.4.因子筛选的稳健性检验.................................................................126.风险提示............................................................................................13 1.研究思路:从特征重构到L1-GMM复合择时模型 在我们前期的《机构行为因子在债市量化择时中的“体检”、筛选与引入》报告中,构建了一套多维度的因子评价体系,并详细验证了机构行为因子在债市择时中的有效性。但该阶段的重心更多停留在因子挖掘与单因子测试层面。随着研究的深入与实盘跟踪的反馈,我们发现这套基础框架在迈向系统化投资时,仍面临着三大亟待突破的实战瓶颈: 其一、原始高频数据的微观噪声过大,且经济意义不明。前期研究直接选用了高度细分的原始机构交易数据,这种处理方式虽然最大程度保留 了全量微观信息,但不可避免地引入了极大的随机扰动。特别是某些机构在特定细分期限上的单日偶发性交易或头寸微调,往往会生成突刺状的伪信号。这些高频噪声使得底层因子在时间序列上呈现出高波动性,给后续模型 的规律识别带来了扰动。 其二、基于Zcore的等权合成模型的预测效能受限,难以应对高维多因子并发的复杂择时场景。过去的回测框架相对基础,多依赖于简单的静态等权合成与线性映射。这种单维度的映射机制不仅择时胜率偏低,并且无法动态剥离冗余信息,也无法随着市场结构的演变自动淘汰失效因子,导致最终合成的择时信号迟钝且胜率平庸,缺乏作为核心交易引擎所需的精准度。其三、机构行为因子的在不同的市场状态下所蕴含的风险收益比会存在变化,这在我们之前的模型中没有被关注。例如,当全市场处于低杠杆、低拥挤度的状态时,机构的连续买入往往是趋势启动的标志,此时应重仓顺势;但若市场已经处于高杠杆、长久期的极度拥挤状态,此时即便买入信号依然强烈,往往也意味着行情已至强弩之末,潜在的踩踏风险正急剧抬升。缺乏宏观状态约束的纯微观模型,极易在“高危区域”盲目追高加杠杆。 综合上述三个问题,本篇报告基于“没有最好的模型最优的因子,只有最适合当前市场环境的模型和因子”的思路。实现了从“单一因子筛选”向“系统化择时模型构建”的根本性跨越,不仅对底层机构因子进行了深度的非线性衍生与降噪,更通过杠杆率、久期对市场状态进行划分,进而构建了一套深度适配机构行为特征的“L1概率预测+ GMM状态感知+共振决策矩阵”综合择时模型。 资料来源:国泰海通证券研究 2.因子重构与筛选 2.1.特征工程:机构行为的衍生构造 在此前报告《机构行为因子在债市量化择时中的“体检”、筛选与引入》(下文简称前期机构行为因子初探)中,我们在构造因子时直接选取机构行为原始数据,其优势在于不会丢失任何信息,但缺陷则在于原始数据颗粒度过高, 使得因子噪声较多,个别机构单日的随机偶发交易极易对模型造成误导。 为此,本文中我们选择将底各个期限利率债净买卖数据与信用债净买卖数据降维合并为短期、中期、长期、超长期四个维度,有效提取出真正反映各类机构久期偏好的宏观交易主线,并增补了宏观杠杆率水平、久期分位数等基准特征,使得微观博弈因子具备了更广阔参考系。 在久期聚合基础上,我们再通过多维度的非线性与时序数学变换,构造出了共计1429个具有机构行为衍生因子,具体而言: ①趋势类:在捕捉机构资金边际交易意愿的“二阶导”变化与平稳性。 A.净买卖加速度:计算过去N日净买入相对T日前同窗口净买入的变化率,捕捉机构资金加仓或减仓的“二阶导”边际变化。 B.累积净买入斜率:对过去N日累积净买入路径进行线性回归,提取斜率因子,刻画机构买入趋势的平稳性。 C.净买入持续性:统计过去N日内连续净买入的最长天数占比。 ②截面类与敏感度:进一步为机构博弈行为打上微观标签。A.动量分层:计算短期净买入动量与长期净买入动量的差值,捕捉资金行为 的期限错配。 B.同久期截面排名:在同一久期层级下,将全市场各机构的N日净买入强度进行横向PCT分位排名,识别当前周期的“主导多头”与“主导空头”。C.资金流入弹性:将机构滚动净买入量与国债收益率变动进行滚动回归求Beta值。该指标有效区分了某类机构的博弈特征。 ③极值类:在于精准识别微观交易结构中的“极度拥挤”与“均值回归”拐点。 A.均值回归强度:计算当前N日累积净买入相对其长期均值的标准化偏离(Z-score),捕捉机构资金的短期超买/超卖状态。 B.极值突破:测量当前净买入突破过去N日极大值/极小值的归一化距离,捕捉机构资金的非线性异动。 C.仓位占用度:计算某类机构的正向买入金额在全市场同久期总买入中的占比。当该指标出现极端飙升时,往往预示着交易拥挤度的提高。 2.2.因子初筛:从海量特征到“进攻-防守”双轨因子库 在我们前期的前期机构行为因子初探中,已经充分验证了基于分周期预测、ICIR、多周期体系进行底层特征筛选的有效性与稳健性。因此,本策略的初筛阶段继续沿用了这一套经过实盘逻辑检验的成熟框架,过滤机构行为因子中的噪声项,同时剔除虽有单次爆发但长期缺乏稳定预测能力的 伪因子。 此外,考虑到近年来利率中枢整体下移的非对称行情特点决定了单一模型无法应对极端市况,因此本文选择根据多空收益特征,将因子强制切分为独立的“进攻库”与“防守库”。在完成初筛后,系统首先对所有因子的多空收益差进行方向对齐,将呈现反转特性的因子统一乘以-1,确保所有特征信号指向一致。随后进行双轨筛选: ①进攻因子库:负责博取收益。严格要求因子的第五组(Q5)多空收益差必须大于5%,且Q5组的胜率必须领先基准胜率至少5%。这些因子在多头情绪发酵时具有较强的进攻性。 ②防守因子库:该部分因子筛选放弃对上涨的预测,转而专注尾部风险。系统要求因子的第一组(Q1)预测下跌的胜率须大于55%,且Q1期间的年化收益需为负。这些因子是债市转向回调时的预警器。 在完成因子双轨划分后,我们基于Z-score等权合成法构建了基础子模型进行初步回测。进攻子模型在收益端表现较好,7-10Y与10+模型年化收益分别达2.48%和5.47%,防守子模型则在风控端展现出极强的韧性,最大回撤较基准明显收窄)。这表明,即便未经过复杂的非线性模型处理,双轨因子池本身已具较好的的区分度与超额获取能力。 3.模型构建:基于涨跌幅度的“进攻-防守”L1双轨预测模型 经过前置因子筛选初筛,我们已将原始特征提纯为高信噪比的“进攻”与“防守”两大因子库。然而,微观因子在不同市场环境下的效果并非一成不 变。为实现从信号到分布的跨越,我们引入了L1逻辑回归模型。 资料来源:国泰海通证券研究 为解决有效因子间的共线性扰动并输出平滑连续的涨跌分布,我们在因子池之上架设了L1正则化逻辑回归模型,并针对进攻因子池与防守因子池设立了互不干扰的训练目标,并采用252个日历日的滚动窗口进行训练,并于每周五盘后进行重训,另外针对重训可能导致的输出概率突变的问题,我们在最终输出时增加5日平滑机制。