DFQ-diversify:解决分布外泛化问题的自监督领域识别与对抗解耦模型 ——因子选股系列之一一五 杨怡玲yangyiling@orientsec.com.cn执业证书编号:S0860523040002刘静涵021-63325888*3211liujinghan@orientsec.com.cn执业证书编号:S0860520080003香港证监会牌照:BSX840 研究结论 DFQ-Diversify模型有效解决分布外泛化问题 ⚫本文提出全新模型DFQ-Diversify,通过引入自监督领域识别与对抗训练机制,实现标签预测任务与领域识别任务的显式解耦。该模型无需人工预设环境变量,能够自主识别潜在领域信息,进而提取出对外部扰动不敏感、跨领域稳定的预测特征,增强模型的分布外泛化能力。 模型创新性地引入“领域-标签”解耦框架 ⚫模型训练流程包含三个核心模块:update_d、set_dlabel和update,通过对抗训练机制同时完成领域识别与标签预测任务,实现两者的显式解耦。 盈余公告异象类因子改进与挖掘:——因子选股系列之一一四2025-04-22时点风险模型:——因子选股系列之一一三2025-04-20ADWM:基于门控机制的自适应动态因子加权模型:——因子选股系列之一一二2025-04-10DFQ-FactorVAE-pro:加入 特征选择 与环境变量模块的FactorVAE模型:——因子选股系列之一一一2025-02-19ABCM:基于神经网络的alpha因子和beta因子协同挖掘模型:——因子选股系列之一一〇2024-12-03相对定价类基本面因子挖掘:——因子选股系列之一〇九2024-10-11KD-Ensemble:基于知识蒸馏的alpha因子挖掘模型:——因子选股系列之一〇八2024-08-19DFQ-XGB:基于树模型的alpha预测方案:——因子选股系列之一〇七2024-08-15基于风险注意力的因子挖掘模型:——因子选股系列之一〇六2024-05-29非线性市值风控全攻略:——因子选股系列之一〇五2024-05-27融合基本面信息的ASTGNN因子挖掘模型:——因子选股系列之一〇四2024-05-27DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案:——因子选股系列之一〇三2024-05-14基本面因子的重构:——因子选股系列之一〇二2024-03-21自适应时空图网络周频alpha模型:——因子选股系列之一〇一2024-02-28DFQ-HIST:添加图信息的选股因子挖掘系统:——因子选股系列之一百2024-02-07基 于 异 构 图 神 经 网 络 的 股 票 关 联 因 子 挖掘:——因子选股系列之九十九2024-01-02 自监督动态领域划分机制提升灵活性与泛化适应能力 ⚫领域是对数据分布的动态划分,用以识别影响预测任务的潜在环境因素。有效的领域划分应帮助模型隔离非目标信息,强化对标签驱动因素的建模能力。⚫Diversify模型实现无监督聚类式领域更新,克服了传统模型依赖预设环境变量的缺陷,使模型能在不同时间和截面维度上自适应发现领域结构。 三重对抗训练机制增强特征解耦与迁移稳健性 ⚫模块间对抗更新:update_d与update模块共享特征提取器,但目标相反,前者强化领域预测、抑制标签预测,后者则反之。⚫双损失对抗平衡:update_d与update模块均采用双损失函数,模块内部同时优化正向与抑制目标,在任务冲突中寻求最优解。⚫梯度反转层机制:通过在反向传播更新时反转梯度符号,实现无需标签监督的高效信息屏蔽,迫使特征提取器学习与标签或领域无关的特征,助力特征解耦。 与Factorvae-pro的对比:从静态环境变量到动态领域建模 ⚫DFQ-Diversify与Factorvae-pro均基于不变学习思想,致力于在训练过程中剥离随环境变化而波动的非稳态特征,提取与标签高度因果相关的稳定因子,实现“风格中性化”,以减少模型对市场风格的依赖。 ⚫Factorvae-pro依 赖 人 工 设 定 时 间 标 签 作 为 环 境 变 量 , 主 观 性 强 、 维 度 单 一 ;Diversify引入自监督学习,动态识别潜在领域,实现对时间与截面双维扰动建模,提升灵活性与泛化能力。Factorvae-pro采用协同训练策略,Diversify则基于对抗机制,通过任务博弈实现特征解耦,提升稳定性和模型适应性。 多市场回测表现优异,泛用性强 ⚫模型在中证全指、沪深300、中证500等多个股票池中均取得显著绩效,尤其在大盘股表现突出。2020-2025年间,中证全指池中IC达12.22%,rankIC达14.58%,多头组合年化超额收益达32.52%。在2024年复杂行情中展现出更强稳健性。 指数增强组合效果稳健,风险受控 ⚫在沪深300与中证500增强策略中,模型分别实现信息比1.89和1.67,年化超额收益11.27%和12.19%。超额收益主要来源于特质收益,占比超过50%。 风险提示 1.量化模型失效风险。2.极端市场环境对模型的影响。 目录 一、研究背景.................................................................................................6 2.1模型整体架构...............................................................................................................7 2.1.1领域学习器(update_d)72.1.2领域预测更新(set_label)82.1.3标签学习器(update)8 2.2模型关键点...................................................................................................................9 2.2.1自监督动态领域划分机制92.2.2三重对抗训练机制112.2.3 Diversify和Factorvae-pro模型的联系12 2.3模型细节对比.............................................................................................................13 2.3.1 Diversify模型VS gru基础模型132.3.2独立瓶颈层VS共享瓶颈层132.3.3双路径训练VS单路径训练142.3.4领域的可视化展示14 二、模型训练细节.................................................................................18 3.1数据说明....................................................................................................................183.2模型超参....................................................................................................................183.3随机种子影响.............................................................................................................19 三、模型结果........................................................................................21 4.1训练情况....................................................................................................................214.2因子整体绩效表现......................................................................................................214.3因子分年绩效表现......................................................................................................264.4因子多头组风险因子暴露...........................................................................................304.5中性化因子表现..........................................................................................................32 四、指数增强组合结果..........................................................................33 5.1指数增强组合构建说明...............................................................................................335.2沪深300指数增强组合..............................................................................................335.3中证500指数增强组合..............................................................................................35 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 六、总结.....................................................................................................37 参考文献......................................................................................................37 风险提示......................................................................................................37 图表目录 图1:Diversify模型VS gru基础模型的绩效表现(2020.01.01-2024.12.31)..........................13图2:Diversify模型中使用独立的bottleneck层VS使用共享的bottleneck层VS不使用bottleneck层的绩效表现(2020.01.01-2024.1