AI智能总结
深度学习系列之一:AI重塑量化,基于大语言模型驱动的因子改进与情绪Alpha挖掘 2026年01月10日 证券分析师于明明执业证书:S0600525120002yumm@dwzq.com.en ◼该框架首先被应用于低频量价因子的挖掘与优化。本文以Alpha158因子库为基础进行优化实验,通过案例剖析(如波动率因子std20)展示了AI能够识别原始因子逻辑缺陷并提出有效改进方案,且优化效果在5至60日的多个窗口期下均具备普适性。进而,通过为模型提供已验证的“成功案例”作为先验知识,本文实现了从零生成新因子的突破,成功挖掘出多个与样例因子相关性低、ICIR在0.8以上的新因子。这些AI生成因子在样本外跟踪中表现持续稳健,部分因子的样本外ICIR能达到1.0以上,证明了该方法论的有效性与鲁棒性。 ◼将研究拓宽至基本面与高频领域后,AI同样展现出强大的因子发现能力。在基本面维度,AI不仅能生成经典因子的增强版本(如现金毛利CGP_TTM),更能从留存收益(REP_LF)、应收账款周转率(ART_QR)等新颖视角,对价值、质量、成长三类因子进行有效拓展与创新。在高频维度,通过赋予AI直接生成Python代码的能力,本文挖掘出一批逻辑新颖且表现优异的高频因子,其中部分强信号因子(如投机波动因子)的多空组合年化收益超过60%。将AI高频因子库融入融合了日K与周K行情数据的AGRU神经网络模型后,模型的年化多头超额收益由18.24%显著提升至25.28%,RankIC均值提升了0.71个百分点。 ◼本文还探索了AI在另类数据处理上的潜力,利用Gemini 2.5 Pro大模型对近百万字的上市公司调研纪要进行深度解析,并通过双速动态衰减模型构建了周度情绪因子。研究发现,该因子呈现出独特的非对称预测能力,即正面情绪与股价上涨关系不强,但负面情绪是未来股价下跌的强预警信号,其空头组合年化超额收益达8.26%,显著优于传统因子。更重要的是,该情绪因子与传统量价及基本面因子的相关性极低,可作为独立且有效的补充信息源。 ◼最终,本文打造了一个多维信息融合的综合策略:将AI挖掘的高频因子与低频行情数据融合进AGRU神经网络,形成核心Alpha;再利用AI文本情绪因子对该核心Alpha进行空头端风险调整,构建了最终的中证800指数增强策略。与未加入调研因子调整的策略相比,最终策略在保持换手率基本不变的情况下,年化超额收益由11.15%提升至11.81%,信息比率由2.18提升至2.31,且近三年超额提升皆超过1个点,进一步验证了AI在量化研究多环节赋能并实现“1+1>2”效果的巨大潜力。 ◼风险提示: 1)结论基于历史数据,在市场环境转变时模型存在失效的风险。本报告所有结论均基于历史数据的回测分析,历史规律不代表未来,当市场风格、投资者结构、宏观环境等发生重大变化时,报告中构建的因子及模型可能失效。2)模型过拟合风险。本报告构建的因子及深度学习模型,可能对历史数据存在过度拟合的问题,即模型可能学习到了历史数据中的噪音而非真实的规律,从而在未来市场的实际应用中表现不佳。3)大语言模型(LLM)自身局限性的风险。本报告的研究依赖于特定版本的大语言模型,且大语言模型的输出具有随机性,同时可能存在模型幻觉问题,导致报告结果无法复现。4)回测设置与实际存在差异的风险。报告中的回测分析基于一系列理想化的假设(如特定的成交价格、固定的交易费用、未考虑市场冲击等),实际交易环境中的成本、滑点和各种限制可能导致策略的真实表现不及预期。5)因子失效风险。报告中通过AI挖掘的因子,其有效性可能随着时间的推移而衰减。特别是在因子逻辑被市场广泛认知或被大量资金使用后,其获取超额收益的能力可能会显著下降。 内容目录 1.深度学习系列之一:AI重塑量化,基于大语言模型驱动的因子改进与情绪Alpha挖掘........82.低频量价因子的优化改进与生成......................................................................................................92.1. Alpha158因子体系解析与优化框架.........................................................................................92.1.1. Qlib算子与Alpha158因子集概述..................................................................................92.1.2.动态交互框架:基于Prompt Engineering的因子优化流程设计..............................122.1.3.优化效果验证:RankIC的跨周期普适性与稳定性突破...........................................172.1.4.以波动率因子为例:洞察模型优化方向.....................................................................222.1.5.改进波动率因子样本外跟踪:持续稳健且优于原始波动因子.................................272.2.从优化到创造:基于大语言模型的新因子生成范式...........................................................282.2.1.从零生成的困境:独立探索下的效率与效果瓶颈.....................................................282.2.2.案例驱动的突破:基于先验知识的低相关性因子挖掘.............................................312.2.3. AI生成因子样本外跟踪:IC出色超额上行................................................................36 3. AI基本面因子挖掘:构建自动化研究框架....................................................................................38 3.1.实验设计:基础数据与处理算子...........................................................................................383.2.人机交互框架:AI因子生成流程详解.................................................................................413.3. AI价值因子挖掘:经典框架的有效拓展与创新...................................................................443.4. AI质量因子挖掘:从盈利能力到运营效率的多维度探索...................................................513.5. AI成长因子挖掘:探索盈利增长的多维定义.......................................................................57 4. AI驱动的高频因子挖掘:从分钟数据到选股信号........................................................................61 4.5.1.数据处理与模型参数.....................................................................................................834.5.2.以日K与周K为特征的AGRU..................................................................................854.5.3.以日K+周K+高频因子为特征的AGRU....................................................................884.5.4. AGRU融合日K+周K+高频因子的周频800指增.....................................................91 5. AI文本分析:对量化选股的增益....................................................................................................93 5.1.通过Gemini模型读取调研文本情绪.....................................................................................935.1.1.近年来调研数量与字数有所提升.................................................................................935.1.2.综合考虑调研情况,选用Gemini 2.5 Pro模型..........................................................945.1.3.打分结果展示.................................................................................................................955.2.从调研评分到调研因子:双速动态衰减模型.......................................................................965.3.调研因子特色:独特的空头规避能力...................................................................................975.4.调研因子对成熟指增框架的再提升.....................................................................................100 7.风险提示..........................................................................................................................................105 图表目录 图1:因子优化流程示意图.................................................................................................................14图2:std20原始因子与第一次改进因子累计RankIC.....................................................................23图3:std20原始因子与第一次改进因子多头超额净值.......