请阅读最后一页的重要声明!分析师孙彬彬SAC证书编号:S0160525020001sunbb@ctsec.com分析师隋修平SAC证书编号:S0160525020003suixp@ctsec.com相关报告1.《 利 率|宏 观 数 据 六 问 六 答 》2025-07-162.《信用| 2025年评级有何变动?》2025-07-143.《 信 用|仍 处 有 利 区 间2025-07-13 》 谨请参阅尾页重要声明及财通证券股票和行业评级标准1模型择时结果分析...................................................................................................................................32模型做了哪些优化?...............................................................................................................................62.1丰富原始因子集..................................................................................................................................62.2优化因子筛选方法..............................................................................................................................62.3算法应用及模型训练..........................................................................................................................83风险提示.................................................................................................................................................10图1. 5日移动平均择时信号及效果...............................................................................................................3图2.模型回报与回撤.....................................................................................................................................4图3.策略净值.................................................................................................................................................4图4.择时区间统计分析.................................................................................................................................5图5.单日输出择时信号及效果.....................................................................................................................6图6.全因子回测效果.....................................................................................................................................7图7.部分选出因子与剔除因子.....................................................................................................................8图8.模型2月中旬至3月底逐日预测结果.................................................................................................9图表目录内容目录 2 谨请参阅尾页重要声明及财通证券股票和行业评级标准1模型择时结果分析首先还是明确,我们的模型输出结果是未来一段时间十年期国债到期收益率上行的概率,只有胜率,没有赔率。当模型输出概率≥60%,未来利率可能有上升趋势,即看空区间;模型输出概率≤40%,则认为未来利率有下降趋势,即看多区间。经过优化以后,第一,模型的胜率更高。从23年3月开始的测试区间看,模型预测方向正确天数总和684天,错误天数34天,胜率95.26%,累计收益177.45bp。图1.5日移动平均择时信号及效果数据来源:Wind,财通证券研究所 3 谨请参阅尾页重要声明及财通证券股票和行业评级标准数据来源:Wind,财通证券研究所从模拟净值曲线角度,我们以模型发出信号的第二天作为策略起点,以中债7-10年国开行债券净价指数作为多头持仓,中证0-1年国债指数作为空头持仓,从2021年6月30日至2025年7月11日进行回测,仅考虑资本利得的情况下,策略净值为1.16,2023年3月至2025年7月11日的样本外测试集区间,策略净值为1.11。图3.策略净值数据来源:Wind,财通证券研究所从区间胜率看,2023年3月至今形成择时区间21个,其中方向正确18个,方向错误3个,区间胜率85.71%。正确区间平均长度38天,错误区间平均长度11.33天,模型的正确率和纠错能力均有所提升。而且模型结果更加灵敏,不会忽略底层细小变化。原始输出概率不会一成不变, 4 谨请参阅尾页重要声明及财通证券股票和行业评级标准5而且相比初代模型,我们更好地把握了2023年二季度的利率下行趋势、2024年三季度的利率波动以及今年5月利率的翻空。图4.择时区间统计分析数据来源:Wind,财通证券研究所第二,回撤控制更好。模型正确区间内的最大回撤为8.29bp,全样本区间最大回撤8.32bp,较初代模型表现有所提升。第三,模型的左侧效果较好。我们依旧使用5日移动平均结果作为择时信号,可以提前5-10天捕捉到利率的多空转换。第四,模型结果依旧稳健,较少出现反复。尤其5日移动平均结果极少出现与波段方向背离的现象。第五,模型的震荡区间控制较好,绝大多数时刻可以发出明确择时信号,仅有10.6%的预测结果发出40%-60%区间的震荡信号。 谨请参阅尾页重要声明及财通证券股票和行业评级标准数据来源:Wind,财通证券研究所2模型做了哪些优化?2.1丰富原始因子集因子选取上,我们从前期模型的231个宏观和微观中高频经济变量扩充至278个,同时加入技术因子、机构行为因子以及情绪因子,对部分因子的差分方式进行调整以更好捕捉指标的边际变化趋势和波动信息,新增150个备选因子,共计428个因子。缺失值处理方面,为防止未来数据泄露,我们使用向前填充方式填补缺失值;频率对齐方面,对于周频和月频数据,我们按照上一期发布数据进行填充将其升为日频;对于月频数据,我们以数据更新时间作为实际应用起点。目标变量方面,我们以中债10年期国债到期收益率为基准,用未来K日的到期收益率减去当期值获得。2.2优化因子筛选方法我们使用全因子在2023年6月至2025年5月20日的区间上进行回测,效果如下图所示。形成正确区间15个,错误区间2个,累计收益达到231.21bp,但我们将模型应用至最新的数据,模型的输出产生了“漂移”,出现了较为严重的过拟合现象。 6 谨请参阅尾页重要声明及财通证券股票和行业评级标准数据来源:Wind,财通证券研究所为了尽可能减少因子数量、规避过拟合问题,我们使用SHAP来进行因子筛选。SHAP(SHapley Additive exPlanations)是一种基于合作博弈论的模型解释方法,能够为任意复杂模型(包括深度学习、集成树等)分配每个特征对模型输出的“贡献值”。它的核心思想借鉴于Shapley值,满足公平性、公平分配与局部准确性。对于第𝑗个因子,其Shapley值定义为:𝜙𝑗=∑𝑆⊆𝑁\{𝑗}其中𝑃是因子总数,|𝑆|是子集大小,系数SHAP将模型输出拆分成基线值与各特征贡献之和,我们可以通过统计所有样本平均绝对SHAP值,来衡量因子的全局重要性。我们首先剔除掉一些有效区间较短的因子,然后使用所有因子进行训练和回测,计算每个窗口因子的SHAP值,在全部窗口中进行均值计算,来提取平均贡献较大的因子,删去贡献较小的因子,实现因子择时能力和稳定性的平衡。 7|𝑆|!(𝑃−|𝑆|−1)!𝑃![𝜈(𝑆∪{𝑗})−𝜈(𝑆)]|𝑆|!(𝑃−|𝑆|−1)!𝑃!是概率权重。𝑓(𝑥)=𝜙0+∑𝜙𝑗(𝑥)𝑃𝑗=1 谨请参阅尾页重要声明及财通证券股票和行业评级标准8进一步,我们使用二分法逐步训练测试,选取效果相对较好的因子数量,最终我们选取151个因子。辅助手段为训练和测试过程中的损失曲线与F1分数,以避免过拟合与欠拟合问题。图7.部分选出因子与剔除因子数据来源:Wind,财通证券研究所2.3算法应用及模型训练第一,底层模型使用两层循环的神经网络。第二,应用L2正则化、Dropout等规避过拟合问题。此外,超参数的调整应当以尽量减小模型复杂度为基准进行尝试。第三,在结果输出阶段,我们不再以20个交易日为重置窗口,而是每个交易日重新训练后输出结果,保证结果的灵敏性和及时性。如果使用滑动窗口进行预测,可能存在以下两个问题:权重滞后性与数据可应用性。固定权重可能由于无标签测试集以及余数部分的存在,权重值最多会出现滞后接近40个交易日的现象,会导致模型输出结果的漂移;同时由于部分数据使用向前填充,在较长区间内保持不变,而日度数据更新频率较高,因此滑动窗口可能无法识别某些数据在更新日 谨请参阅尾页重要声明及财通证券股票和行业评级标准期的变化对利率的影响。例如我们的呈现结果中,以2月中旬到3月底、6月底以来做逐日输出测试,发现模型结果更加灵敏,同时准确度也较高。只是需要注意,在样本内区间训练时,我们仍以500个交易日为一个窗口,每20个交易日滑动一次窗口。图8.模型2月中旬至3月底逐日预测结果数据来源:Wind,财通证券研究所 9 谨请参阅尾页重要声明及财通证券股票和行业评级标准3风险提示1、模型失效风险。模型输出的信号是基于特定的模型和历史数据计算得出的,然而市场环境是复杂多变的,包括宏观经济形势、政策调整、市场参与者行为等因素都可能发生变化。随着市场环境的改变,模型所依据的历史数据和统计规律可能不再适用,导致模型失效,从而使得模型输出的信号无法准确反映债市多空动能的真实情况,进而影响投资者基于此信号做出的投资决策。2、因子失效风险。因子在历史数据中可能表现出与债市利率走势相关的特性,但未来这些因子的作用方向和作用强度可能发生变化。3、数据质量风险。模型的计算依赖于准确、完整的数据。