您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:透视固收+系列专题(二):基于多目标导向吉洪诺夫回归,固收+基金多资产仓位测算 - 发现报告

透视固收+系列专题(二):基于多目标导向吉洪诺夫回归,固收+基金多资产仓位测算

2025-10-12 申雅文,田露露 国金证券 Lee
报告封面

分析师:申雅文执业编号:S1130525070007分析师:田露露执业编号:S1130521110001 2025/10/12 内容摘要 固收+基金仓位测算研究背景与模型介绍 ➢低利率市场环境下传统固收资产收益率持续下行,固收+基金以“固收打底、权益增强”的多资产配置模式,成为承接资金流向、实现稳健增值的重要工具。资产仓位的高频监测,能够及时观测组合变化、助力投后跟踪及了解资金流向,识别风险暴露与增强机会。另一方面,高频仓位数据可帮助投资者评估基金是否契合当前市场节奏,避免仓位漂移或风格失效。 ➢本专题创新性提出带有多目标导向的吉洪诺夫回归模型,在解决传统共线性问题基础上,首次对多元资产组合仓位的高频测算提出针对性的解决方案。重新定义吉洪诺夫正则化框架下的损失函数与增广矩阵结构。损失函数由三部分构成:拟合优度项、组结构稳定性项和仓位上限软约束项。将仓位的动态先验、合规规范嵌入优化框架,通过搜索算法遍历寻找每一项最优惩罚系数,使解同时具备数值最优性与实际合规性。 ➢测算仓位与季报真实仓位绝对误差来看,固收+基金池2017年至2025二季度末,纯债端误差中位数为4.48%,股票端误差中位数为2.40%,转债端误差中位数为3.80%;仓位调整方向胜率平均值为63.63%。对市场头部产品(规模大于50亿)测算仓位与真实仓位绝对误差,纯债端误差中位数为2.18%,股票端误差中位数为2.94%,转债端误差中位数为2.70%,模型能够精准且有效的捕捉头部产品调仓方向和幅度。 固收+基金仓位测算模型应用 8月末仓位测算结果显示,固收+基金的股票仓位中枢与行业集中度持续提升,资金情绪积极,在科技、军工、资源等头部板块形成共识,显示出成长与周期并重的布局思路。其中,业绩领先的基金更倾向于采取积极的权益策略,其超额收益主要来源于显著高配科技、制造等成长行业,同时低配能源与周期板块。 ➢应用2:显著调仓行为识别:胜率近八成,有效捕捉主动决策该模型对基金仓位的测算虽包含价格波动影响,但在识别幅度大于8%的显著调仓时准确率高达79%,能有效捕捉基金经理的主动仓位管理行 为。为基金评价与投资实践提供了关键价值:既能辅助筛选具备持续择时能力的产品,也能在市场风格转换时及时捕捉机构资金的配置信号。 风险提示 ➢模型失效风险、政策与经济形势不确定性、基金经理风格变动风险。 ➢基金相关信息及数据仅作为基金研究使用,不作为募集材料或者宣传材料。 ➢本文涉及所有基金历史业绩均不代表未来表现。 数据来源:Wind、国金证券研究所 固收+基金仓位测算研究背景及模型介绍 背景介绍&市场主流模型方法回顾 为什么要做仓位测算?——固收+基金资产结构洞察的必要性 ➢基金仓位测算是提升投资透明度与强化风险管控的核心手段。由于基金定期披露存在时间滞后且信息覆盖有限,投资者难以及时全面掌握基金在各类资产上的实际配置情况。通过建立系统化的仓位测算框架,可高频地量化追踪基金资产敞口,实现对投资风险的动态监测。同时,在仓位测算结果的基础上通过拆解组合收益与指数收益,可评估基金经理的主动管理能力及超额来源,为投资决策提供科学依据。 ➢在低利率环境下,传统固收资产收益率持续下行,固收+基金凭借“固收打底、权益增强”的多资产配置模式,成为承接资金流入、实现稳健增值的重要工具。固收+基金作为多资产组合,在资产配置上与传统权益或纯债基金存在显著差异,因此投资者对这类基金仓位测算的关注度更高。对资产仓位进行高频监测,可以及时观察同业配置变化、跟踪资金流向,并识别潜在风险敞口与增厚收益机会,为组合的动态优化提供依据。同时,高频仓位数据亦可帮助投资者评估基金策略是否与市场节奏匹配,避免仓位偏离或投资风格失效,从而提升组合的风险控制和收益管理能力。 市场主流仓位测算模型回顾 ➢当前市场主流对基金仓位测算的方法是:基于基金净值与市场指数构建回归模型,并辅以组合优化框架对仓位进行估算。能在够提供高频、动态仓位追踪的同时,又能通过优化约束提升结果的合理性。基本公式如下: 净值回归:机器学习模型(如Lasso回归、岭回归、最小二乘回归等)利用指数所代表的资产收益率去拟合基金收益率,从而得到基金在各类资产的仓位分布。组合优化:在上述回归结果的基础上,引入约束条件(仓位非负、总仓位上限等),通过优化算法得到更符合实际投资逻辑的仓位组合。有效减少极端估算值,提高测算结果的稳定性。 •𝑅𝑡:t时刻,基金的收益率•𝑊𝑖𝑡:t时刻,基金在资产类别𝑖的仓位•𝑟𝑖𝑡:t时刻,指数𝑖所代表的资产类别的收益率•𝑏:残差项 主流测算模型在固收+基金应用中的系统性困境 无法测算多元资产组合 显著低估纯债仓位 主流仓位测算模型主要针对单一资产类别,对固收+等多元资产组合,尚未形成系统性的测算框架。这一局限性在转债资产上尤为显著:转债兼具股性与债性,传统模型无法准确剥离其在组合中的真实仓位,进而影响对基金整体资产暴露和风险收益特征的判断。 回归模型会优先用更少的指数来解释更多的变化,而股票、转债价格振幅远大于纯债,导致纯债仓位被系统性低估,股票、转债仓位被系统性高估。然而,债券是固收+基金的主要底仓,若其仓位被低估,将影响组合特征的真实反映,导致资产配置结构失真。  回归变量设定偏差 可解释性低 资产间及资产内部指数间存在较高的相关性,导致测算过程中产生大量近似最优组合解。由于解空间庞大,单一测算结果难以直接验证其准确性或稳健性,也增加了对模型假设和参数敏感性的依赖,降低测算结果的可解释性和实用性。 传统回归测算一般使用宽基或行业指数作为回归变量,当基金持仓成分与指数成分的组成和权重存在显著偏离时,回归残差项不再是一个纯粹的噪声,而是还包含了基金经理选股带来的Alpha,导致最终测算仓位与真实值偏差显著。 吉洪诺夫回归:解决多元资产测算难题的新方法 吉洪诺夫回归是什么? 吉洪诺夫回归是在最小二乘的基础上,对回归系数增加形状与大小层面的约束,以缓解回归变量病态数据及多重共线性问题。对于给定样本(𝑋∈ℝ𝑛×𝑝,𝑦∈ℝ𝑛),吉洪诺夫回归定义的损失函数为:𝒎𝒊𝒏{∥𝒚−𝒘𝑿∥𝟐𝟐+𝝀∥𝑮𝒘∥𝟐𝟐},𝜆为正则强度,𝐺为吉洪诺夫矩阵(可以是任一结构化矩阵),该问题的封闭解为:ෝ𝑤=൫𝑋⊤𝑋+𝜆𝐺⊤𝐺)−1𝑋⊤𝑦。其中,当𝐺为单位矩阵的时候,传统吉洪诺夫回归就是岭回归,因此吉洪诺夫回归也称岭回归的推广形式。 为什么吉洪诺夫回归对多元资产的共线性问题更适用? 各类回归模型的区别主要在多重共线性问题的处理上有所不同,设两个高度相关的指数𝑥1与𝑥2: Lasso回归(变量选择,任意挑选) 对高度相关的变量,Lasso回归往往在这些变量间任意选取一个(或把权重分配给其中少数几个),使得某些系数为零从而降低L1惩罚,并且对预测误差影响不大,但Lasso回归会导致预测结果不稳定(不同样本或微小扰动均可能会选择到不同的变量)。 岭回归(分组效应,变量平均) 当𝑥1≈𝑥2时,岭回归的惩罚项会均匀收缩两个系数,极端情况下即𝑥1=𝑥2时,岭回归把高度相关的变量视为一个组,平均分类组内权重,使两个变量的系数完全相等。与Lasso回归相比,岭回归不会“抛弃”任何变量,而是让相关变量的系数接近,平滑和均匀分配系数。 吉洪诺夫回归(组内可控,组间独立) 6通过设计特定的正则化吉洪诺夫矩阵𝐺,对资产内部指数解决共线性的同时,保持不同资产类别指数间正交,确保对每类资产的约束和惩罚不会影响到其他资产,以此做到对多元资产的回归测算,在转债这类同时高度关联股票和债券的资产尤其有效。相比之下,Lasso回归可能因变量选择而丢失部分信息;岭回归对所有系数进行均匀收缩,缺乏对不同资产类别的差异化处理。因此,吉洪诺夫回归在多元资产的仓位测算中具有天然优势。 吉洪诺夫回归损失函数优化:多目标结构化引导取代硬性约束 为什么放弃硬约束,选择修改损失函数? 破坏数值最优性:在回归得到的最优系数基础上进行调整,修改后的结果已不再是原回归目标函数的最优解;缺乏实际经济含义:经过硬性修正的系数可能偏离数据本身的结构特征,损失了回归对市场信息的真实反映;可解释性下降:对于投资组合而言,硬限制后的仓位可能违背资产间的共线性关系或结构逻辑,降低策略的可控性和解释性。所以我们对吉洪诺夫回归的适配性优化,选择将约束条件融入损失函数,通过正则化项在优化过程中对仓位进行自然控制,从而实现软约束。当选取合适的正则系数时,模型既能保留回归求解的数值最优性,又能兼顾实际投资限制。 我们如何对损失函数优化? 传统吉洪诺夫算法基础上,我们对损失函数引入L1与L2正则化,以满足投资约束。 L2正则用于保持仓位与历史参考的平滑性,公式为∥𝐰∥22=𝑤12+𝑤22+⋯+𝑤𝑛2。本模型中,L2正则通过惩罚每类资产与最新季报真实仓位的偏离,使固收+基金每类资产上的调仓保持连续性和稳定性。L1正则用于控制总仓位,公式为∥𝐰∥1=∣𝑤1∣+∣𝑤2∣+⋯+∣𝑤𝑛∣。本模型中,L1正则通过惩罚系数的绝对值之和,实现仓位的软上限约束,对应固收+基金总仓位不超过140%的监管要求。正则化强度自适应选择,损失函数的每一项赋予独立的正则化系数𝝀₁,𝝀₂,𝝀₃,网格搜索优化方法遍历调参,以实现拟合优度、总仓位上限与仓位偏离之间的平衡。𝟐 最终我们的模型定义损失函数为:𝒎𝒊𝒏{𝝀𝟏(𝒚−𝒘𝑿)𝟐𝟐+𝝀𝟐(𝑷𝒑𝒓𝒆𝒗−𝑷𝒑𝒓𝒆𝒅)𝟐+𝝀𝟑(‖𝒘‖𝟏−𝟏.𝟒)} •第一项控制拟合基金收益率误差。•第二项控制测算仓位与上一季度真实仓位的平滑性。•第三项控制基金仓位和140%上限的约束。 定义吉洪诺夫回归方程:𝐿1/𝐿2正则化条件下的统一建模框架 回归方程 线性展开 损失函数:𝑳(𝒘)=𝝀𝟏(𝒚−𝒘𝑿)𝟐𝟐+𝝀𝟐(𝑷𝒑𝒓𝒆𝒗−𝑷𝒑𝒓𝒆𝒅)𝟐𝟐+𝝀𝟑‖𝒘‖𝟏−𝟏.𝟒直线方程定义为: 𝑦为该基金在过去20个交易日的收益率序列; 𝑃prev为该基金上一季度的真实资产仓位向量,其中 •𝑃𝑏𝑑为纯债仓位(即债券仓位扣除转债仓位),•𝑃𝑠𝑡𝑘为股票仓位,•𝑃𝑐𝑣为转债仓位; 𝑋为所选指数池在过去20日的收益率矩阵; 𝐺为块对角化的吉洪诺夫增广矩阵,用于在正则化过程中对不同大类资产的仓位进行隔离,保证约束独立性;𝐼为全1行向量,用于限制资产仓位上限;𝑤为待估的指数仓位向量;𝑏为截距项。 8表达式体现了基金在历史收益拟合、上一季度真实仓位约束以及𝐿1/𝐿2正则化条件下的统一建模框架,为后续基于梯度/次梯度下降法的最优仓位求解提供了基础。 含L1/L2正则的回归问题求解:梯度与次梯度下降法 回归算法如何求解? 若直接对该回归问题的线性方程求解,易遇到矩阵不可逆且L1正则不可导的情况,因此算法实际选择对损失函数求导并用梯度下降求解,当损失函数误差下降至最小时,此时的系数解即为基金在每个资产上的仓位。 求导步骤 最终求导方程(次梯度条件下): 令损失函数:𝑳(𝒘)=𝝀𝟏(𝒚−𝒘𝑿)𝟐𝟐+𝝀𝟐(𝑷𝒑𝒓𝒆𝒗−𝑷𝒑𝒓𝒆𝒅)𝟐𝟐+𝝀𝟑‖𝒘‖𝟏−𝟏.𝟒其中常数1.4不影响优化。分别对损失函数的每一项求导(梯度)可得: 𝝀𝟏𝑿𝑿𝑻𝒘+𝝀𝟐𝑮𝑻𝑮𝒘−𝝀𝟏𝑿𝒚−𝝀𝟐𝑮𝑻𝑷𝑷𝒓𝒆𝒗+𝝀𝟑𝒔𝒊𝒈𝒏𝒘∋𝟎其中𝜕𝑤1是L1范数的次微分。由于该方程不存在解析解,我们采用梯度/次梯度下降法对参数𝑤进行迭代更新,从而逼近最优解,获得基金在各类资产上的最优仓位估计。该方法能够在保证𝐿2平滑正则的同时,引入𝐿1约束,从而兼顾稳健性与可解