您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华安证券]:学海拾珠系列之二百六十四:不确定性感知因子选择驱动的高维CAE资产定价框架 - 发现报告

学海拾珠系列之二百六十四:不确定性感知因子选择驱动的高维CAE资产定价框架

2026-01-28 骆昱杉,严佳炜 华安证券 陈宫泽凡
报告封面

——学海拾珠系列之二百六十四 主要观点: 执业证书号:S0010522110001邮箱:luoyushan@hazq.com 经典线性因子模型的局限 分析师:严佳炜执业证书号:S0010520070001邮箱:yanjw@hazq.com 经典线性因子模型(如APT、Fama–French)假设收益由少量固定因子驱动,依赖线性与平稳性假设,难以捕捉公司特征的异质性和市场状态的时变特性,也无法有效刻画动态、非线性或时变依赖关系。 两阶段潜在因子建模与不确定性感知筛选方法 先用CAE从公司特征与资产收益中提取潜在因子;再用IID-BS、Q-Boost、ZS-Chronos对各因子预测,基于分位数预测的平均绝对偏差量化不确定性并筛选可预测因子,构建切点投资组合后映射为资产权重。三模型分别提供无模型基准、捕捉局部非线性、零样本深度序列预测,形成多样信号支持稳健组合构建。 1.《融入趋势跟踪的风险平价策略——“学海拾珠”系列之二百六十三》 预测不确定性筛选因子提升CAE组合表现 实证表明,基于预测不确定性筛选因子可提升多模型风险调整收益,最优组合常仅用部分因子。集成IID-BS、Q-Boost与ZS-Chronos三类低相关模型,策略表现突出(夏普比率2.20、最大回撤<10%)。理论支撑与消融分析验证方法有效性,表明不确定性驱动维度控制是扩展CAE关键,为高维因子框架的偏差–方差权衡提供原则性方案。 2.《投资者情绪能否预测时间序列动量?——“学海拾珠”系列之二百六十二》 3.《虚假信息可被容忍吗?解析其对波动的影响与边界——“学海拾珠”系列之二百六十一》 文献来源 4.《基于组合波动率与峰度的资产配置模型——“学海拾珠”系列之二百六十》 核心内容摘选自Ryan Engel, Yu Chen, Pawel Polak, Ioana Boier于2025年11月25日在Quantitative Finance上的文章《ScalingConditional Autoencoders for Portfolio Optimization via Uncertainty-Aware Factor Selection》。 5.《基于马氏距离K-Means聚类的价值-成长股分类——“学海拾珠”系列之二百五十九》 6.《重新审视回撤规则:实证反思与框架重构——“学海拾珠”系列之二百五十八》 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 正文目录 1引言.......................................................................................................................................................................................................42研究方法..............................................................................................................................................................................................53实证分析..............................................................................................................................................................................................83.1CHRONOS模型的前瞻性偏差消融研究.................................................................................................................................144最高的年化收益率总结......................................................................................................................................................................16风险提示:.............................................................................................................................................................................................17 图表目录 图表1文章框架--------------------------------------------------------------------------------------4图表2不确定性感知因子选择的模型架构-----------------------------------------------------------------5图表3潜在因子预测模型概览--------------------------------------------------------------------------7图表4Q-BOOST模型参数------------------------------------------------------------------------------7图表5CAE和Q-BOOST模型的超参---------------------------------------------------------------------9图表6CAE模型下样本外的风险收益前沿----------------------------------------------------------------9图表7不同模型的表现比较(CAE,IID-BS,Q-BOOST,ZS-CHRONOS)----------------------------------------10图表82000年至2024年各预测模型在自适应Κ∗选择下的累计收益----------------------------------------12图表9各策略在市场回撤年份的年度收益---------------------------------------------------------------12图表10 2000年至2024年各自适应Κ∗策略样本外收益的相关系数矩阵------------------------------------12图表11自适应选择方法构建的投资组合的样本外性能指标与扩展因子回归结果------------------------------13图表12数据集构建前后的模型性能对比----------------------------------------------------------------15图表13数据集构建前后的性能统计(2011–2017年与2018–2024年)------------------------------------15 1引言 资料来源:华安证券研究所整理 理解资产收益的截面差异依然是实证金融领域的核心问题。经典的线性因子模型——例如套利定价理论(Arbitrage Pricing Theory, APT)或Fama–French——假设资产收益由少量潜在或可观测的风险因子驱动,且这些因子载荷在各公司间固定不变。尽管此类模型在理论上优雅且具有经济可解释性,但它们依赖于较强的线性与平稳性假设,并且往往忽视了公司特征中丰富的异质性以及不断变化的市场状态。近期研究已指出这些方法的局限性,尤其是它们在捕捉动态、非线性依赖关系或时变敞口方面的不足。 为克服这些局限,我们在文献Autoencoder Asset Pricing Models(2020)提出的条件自编码器(CAE)模型基础上展开研究。该模型通过允许因子载荷非线性地依赖于公司特有的滞后特征,推广了线性因子模型。CAE通过神经网络架构联合学习潜在因子与基于特征的敞口,从而对收益生成过程实现更具表达力的刻画。这一结构提升了潜在因子收益的信噪比,并改善了其样本外预测的稳定性。深度潜在因子模型的最新进展也印证了在高维金融环境中对公司层面变量与潜在风险之间交互进行建模的重要性。 CAE的一个核心建模选择是潜在因子空间的维度K。传统实现通常将K限制在小值(例如K≈5),以保持可解释性并限制过拟合。相比之下,我们在高维空间下运作(最高至K=50),并引入一种事后筛选程序,根据因子的样本外可预测性来选择潜在投资组合。对于每个潜在因子,多个预测模型会生成预测分布,我们据此量化预测不确定性。随后,根据预测稳定性对因子进行排序,仅保留那些预测最为可靠的因子。这种不确定性感知的选择既利用了高维潜在表示的表达能力,又控 制了估计风险。通过基于预测置信度对因子排序,该过程显式地最小化样本外期望效用损失,从而使因子选择与投资组合优化的下游目标保持一致——这与传统上仅依据纯统计重构准则来确定K的做法形成鲜明对比。 我们的贡献兼具方法学与实证两方面。首先,我们提出了一种新颖的不确定性感知因子投资组合选择框架,将经由CAE提取的高维潜在投资组合与来自多种先进预测模型的预测信号相结合。其次,我们证明,当高维CAE与基于预测驱动的因子选择相结合时,其表现显著优于传统的低维因子模型,能够获得明显更高的夏普比率(Sharpe)、索提诺比率(Sortino)和欧米伽比率(Omega),同时将最大回撤控制在10%以下。第三,我们验证了由零样本预训练模型(如Chronos)和分位数梯度提升回归树生成的预测能够提供互补的预测信号,大幅增强CAE框架中常用的基于独立同分布(IID)的基线预测。因此,这些多样化预测的集成能够产生稳健的、市场中性的投资组合,具备优异且稳定的样本外表现。我们的研究结果凸显了预测不确定性作为因子可预测性的实用指标的价值,并验证了深度潜在模型与现代前沿预测技术在现代资产定价应用中的有效性。 2研究方法 我们采用一个两阶段流程: 1)使用CAE模型从公司层面特征(如市值、资产增长率、收益动量)以及资产收益中提取潜在因子投资组合;2)利用多种模型对每个潜在因子的时间序列进行预测,并基于预测不确定性指导筛选具有可预测收益的投资组合。 资料来源:《Scaling Conditional Autoencoders for Portfolio Optimization via Uncertainty-Aware Factor Selection》,华安证券研究所 说明:首先,条件自编码器(CAE)模型从公司特征中提取高维潜在因子投资组合。接下来,时间序列预测模型为每个因子生成点预测与分位数预测,并据此进行不确定性量化。随后,根据不确定性对因子进行排序,选出最具可预测性的子集,在因子空间中进行切点投资组合优化,之后再映射为可交易资产的权重。 令𝑟i,s∈R表示资产i在时间s的超额收益,𝑧𝑖,𝑠−1∈𝑅𝑃表示其滞后的公司特征。CAE将资产收益建模为: 其中 𝛽𝑖(𝑧𝑖,𝑠−1)∈𝑅𝐾是一个将特征映射到因子载荷的非线性函数, 𝑓?