本报告探讨了基于大语言模型(LLM)和提示工程(Prompt Engineering)的自动化因子研究框架在量化投资中的应用潜力。研究发现,AI在低频量价因子、基本面因子和高频因子领域均展现出强大的因子发现和改进能力。
低频量价因子优化: 通过人机交互的迭代循环,AI成功地对Alpha158因子库中的经典因子进行了深度优化,例如波动率因子std20,其RankIC均值和ICIR均得到显著提升。更进一步,通过提供已验证的“成功案例”作为先验知识,AI成功生成多个与现有因子低相关性、ICIR在0.8以上的新因子,并在样本外跟踪中表现持续稳健。
基本面因子挖掘: AI不仅能够生成经典因子的增强版本,例如现金毛利CGP_TTM,更能从留存收益(REP_LF)、应收账款周转率(ART_QR)等新颖视角,对价值、质量、成长三类因子进行有效拓展与创新。例如,留存收益因子REP_LF与所有样例因子的相关性均低于70%,展现了其独特的逻辑视角,并在全市场范围内展现出优异的选股能力。
高频因子挖掘: 通过赋予AI直接生成Python代码的能力,挖掘出一批逻辑新颖且表现优异的高频因子,例如投机波动因子(speculative_frenzy_instability)和极端加速度方差占比因子(extreme_gamma_burst_ratio)。这些因子在多空组合中展现出强大的选股能力,年化收益超过60%。将AI高频因子融入融合了日K与周K行情数据的AGRU神经网络模型后,模型的年化多头超额收益由18.24%提升至25.28%,RankIC均值提升了0.71个百分点。
情绪Alpha挖掘: 利用Gemini 2.5 Pro大模型对近百万字的上市公司调研纪要进行深度解析,并通过双速动态衰减模型构建了周度情绪因子。研究发现,该因子呈现出独特的非对称预测能力,即正面情绪与股价上涨关系不强,但负面情绪是未来股价下跌的强预警信号,其空头组合年化超额收益达8.26%,显著优于传统因子。该情绪因子与传统量价及基本面因子的相关性极低,可作为独立且有效的补充信息源。
综合策略构建: 将AI挖掘的高频因子与低频行情数据融合进AGRU神经网络,形成核心Alpha;再利用AI文本情绪因子对该核心Alpha进行空头端风险调整,构建了最终的中证800指数增强策略。与未加入调研因子调整的策略相比,最终策略在保持换手率基本不变的情况下,年化超额收益由11.15%提升至11.81%,信息比率由2.18提升至2.31,且近三年超额提升皆超过1个点,进一步验证了AI在量化研究多环节赋能并实现“1+1>2”效果的巨大潜力。
研究结论: AI重塑了量化研究的范式,推动了从传统的纯“数据驱动”向“知识与逻辑驱动”的演进。AI能够有效规避过拟合,内嵌领域知识,进行高效的“智能探索”,并实现多维度信息融合,为量化投资带来显著的增益。