主要观点: 分析师:严佳炜执业证书号:S0010520070001邮箱:yanjw@hazq.com ⚫研究背景与动机 运用现有大语言模型进行量化因子挖掘能够理解算子的经济含义并生成语义合理的因子表达式,从而改善候选质量。本文由此提出一种有语义引导的定向搜索,以LLM替代随机变异算子,并将回测反馈闭环注入每轮迭代因子生成过程,实现有语义引导、可持续进化的Alpha因子自动发现。 ⚫LLM引导下的搜索机制能够在有限轮次内高效定位高质量因子 该模型是有语义引导的定向搜索:LLM在生成新候选之前,已经读取了当前最优因子的内容和绩效,因此生成的候选在金融逻辑上更合理 , 无 效 输 出 比 例 下 降 ,每 一 轮 的 搜 索 效 率 远 高 于 盲 目 随 机。 从Alpha158的38个种子因子出发,经15轮迭代后样本内IC从0.010提升至0.040,ICIR翻倍至0.24,证明该搜索机制能够在有限轮次内高效定位高质量因子。 1.《基于宏观和市场的状态感知型风险平价——“学海拾珠”系列之二百七十四》 2.《集中度迷思:集中度上升是否意味着风险上升?——“学海拾珠”系列之二百七十三》 ⚫在因子生成阶段引入LLM进化搜索能显著提升稀疏组合实盘绩效 在稀疏投资组合优化任务中,部署的两个大模型在美国50股、恒生45股、沪深300三个市场的累积财富均优于全部对比方,同时夏普比率同样领先所有基准。 3.《自适应市场状态的强化学习在资产配置中的应用——“学海拾珠”系列之二百七十二》 4.《基于时间序列推理的金融分析技术——“学海拾珠”系列之二百七十一》 ⚫文献来源 核心内容摘选自Yihong Wu,Chengcan Lou,Jiayuan Zhan等于2026年发布在ICASSP上的文章《EvoAlpha: An LLM-EnhancedEvolutionary Framework for Formulaic Alpha Mining》。 5.《解码共同基金业绩:基于深度学习的动态收益模式——“学海拾珠”系列之二百七十》 6.《股价路径凸性与未来收益预测——“学海拾珠”系列之二百六十九》 ⚫风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 正文目录 1引言..........................................................................................................................................................................................42模型框架与算法设计.............................................................................................................................................................52.1模型框架..................................................................................................................................................................................52.2算法流程..................................................................................................................................................................................63LLM提示词设计...................................................................................................................................................................73.1变异提示词.............................................................................................................................................................................73.2交叉提示词.............................................................................................................................................................................84多轮迭代下的因子趋势........................................................................................................................................................95不同稀疏度与市场条件下的投资组合优化对比.............................................................................................................106结论........................................................................................................................................................................................117附录........................................................................................................................................................................................127.1提示词....................................................................................................................................................................................127.2ALPHA158因子....................................................................................................................................................................14风险提示:.............................................................................................................................................................................................15 图表目录 图表1文章框架...........................................................................................................................................................................................................4图表2EA因子搜索框架...........................................................................................................................................................................................5图表3算子表达式:交叉和变异..........................................................................................................................................................................6图表4EA算法流程....................................................................................................................................................................................................7图表5各轮最优变异因子.........................................................................................................................................................................................8图表6典型交叉因子..................................................................................................................................................................................................8图表7静态搜索实验的样本内指标演化............................................................................................................................................................9图表8静态搜索实验的样本外指标演化....................................................................................................................................