AI智能总结
报告发布日期刘静涵杨怡玲一六选股系列之一一五子选股系列之一一四三选股系列之一一一 研究结论HIST模型的回顾与不足⚫为克服传统时序预测模型忽视股票间横截面关系、泛化能力不足的问题,HIST模型创新性地引入股票截面交互机制,采用级联残差结构模拟投资者“先行业、后风格、再个股”的分析逻辑,分阶段提取预定义概念、隐藏概念与个股特质信息,提升模型的可解释性与稳定性。但该模型仍存在不足:(1)隐藏概念构建机制粗糙;(2)关联权重计算生成失真;(3)概念信息聚合缺乏结构化传播机制;(4)个股残差信息未充分剥离共性干扰,影响特质预测纯度与稳定性。HIST-HyperGCN模型:引入超图结构提升结构表达能力⚫HIST-HyperGCN模型将HIST中的注意力机制替换为超图卷积(HyperGCN),改进包括四方面:(1)预定义概念建图改为静态0-1结构,更贴合真实行业归属;(2)隐藏概念采用可学习因子原型,表达更稳定清晰;(3)关联权重通过结构归一化传播代替“余弦+softmax”,保留特征模长,避免权重失真;(4)概念信息传播采用统一的超图卷积路径,提升高阶联动建模能力与表达效率。HIST-TRCL模型:时间残差对比学习增强预测稳健性⚫HIST-TRCL引入时间残差对比学习(TRCL),构建个股历史特质与未来特质之间的自监督对比任务,迫使模型主动学习出跨时间稳健一致的股票特质特征表达。同时对InfoNCE损失进行优化,采用平方余弦相似度增强正负样本区分效果,显著提升模型的跨时间泛化性能。FactorGCL模型:融合超图与时间残差的集成框架⚫FactorGCL融合HyperGCN与TRCL两大机制,通过超图卷积网络(HyperGCN)提取预定义与隐藏概念的高阶关联信息,再结合时间残差对比学习(TRCL)机制强化股票特质特征的跨时间一致性建模,最终统一整合形成结构化且稳健的因子预测框架。模型通过多路径的信息聚合与融合机制,同时兼顾了股票横截面高阶关联的结构表达能力和收益预测的时间泛化能力,显著提升了因子预测的精度与稳健性。模型实证结果与绩效分析⚫DFQ-FactorGCL模型在中证全指、沪深300、中证500和中证1000股票池中均表现优异。中证全指股票池IC为12.46%,rankIC为16.14%,多头组合年化超额收益达32.65%;沪深300股票池IC为8.71%,rankIC为10.61%,多头年化超额收益为12.37%。指数增强组合绩效稳健、风险可控⚫模型在指数增强策略中表现突出:沪深300股票池年化信息比为2.20,年化对冲收益12.14%,超额收益中66%来自特质收益;模型组合具有明显的Alpha获取能力,风格暴露控制良好,风险稳定可控。风险提示1.量化模型基于历史数据分析,未来存在失效风险,建议投资者紧密跟踪模型表现。2.极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。DFQ-FactorGCL:基于超图卷积神经网络和时间残差对比学习的股票收益预测模型——因子选股系列之一一七 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。目录引言...............................................................................................................7一、HIST模型回顾........................................................................................81.1 HIST模型整体架构......................................................................................................81.2 HIST模型核心要点....................................................................................................101.3 HIST模型的“类图神经网络”结构设计.........................................................................131.4 HIST模型的非线性因子模型理解视角........................................................................131.5 HIST模型不足之处....................................................................................................141.6 HIST模型绩效...........................................................................................................16二、HIST-HyperGCN模型...........................................................................172.1超图(Hypergraph)介绍...........................................................................................172.2超图卷积神经网络(HyperGCN)介绍......................................................................172.3HIST-HyperGCN模型具体做法..................................................................................212.4 HIST-HyperGCN模型绩效.........................................................................................25三、HIST-TRCL模型...................................................................................263.1时间残差对比学习(Temporal Residual Contrastive Learning,TRCL)介绍...........263.2 HIST-TRCL模型具体做法..........................................................................................283.3 HIST-TRCL模型绩效.................................................................................................32四、FactorGCL模型....................................................................................334.1模型结构....................................................................................................................334.2模型训练和预测过程...................................................................................................344.3隐藏因子的可视化分析...............................................................................................35五、DFQ-FactorGCL模型细节....................................................................385.1数据说明....................................................................................................................385.2模型超参....................................................................................................................395.3随机种子影响.............................................................................................................40六、DFQ-FactorGCL模型结果....................................................................416.1训练情况....................................................................................................................416.2因子绩效分析.............................................................................................................426.3模型相关性.................................................................................................................46 2 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。3七、指数增强组合结果.................................................................................477.1指数增强组合构建说明...............................................................................................477.2沪深300指数增强组合..............................................................................................477.3中证500指数增强组合..............................................................................................497.4中证1000指