行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

量化研究参考系列之九：大语言模型驱动因子挖掘的模型演进与框架梳理

2026-06-30 刘静涵东方证券张兵

研究结论

本文系统梳理了海内外金融工程与AI量化相关学术文献，将大语言模型驱动因子挖掘的历史演进脉络划分为七个发展阶段：

理论因子阶段：以CAPM、Fama-French等框架解释收益来源，形成量化投资的经济逻辑基础。
公式化Alpha阶段：将投资假设转化为标准化字段、算子和表达式，建立可计算、可回测的因子生产范式。
传统自动搜索阶段：通过遗传规划、强化学习等方法批量扩展候选因子，提高初筛效率。
LLM直接生成阶段：将自然语言投研思路转化为因子定义、公式草案和代码框架，降低研究想法到可执行候选的转换成本。
文本Alpha与另类数据阶段：把公告、新闻等非结构化信息转化为可回测标签，拓展因子信息来源。
知识增强与Agent闭环阶段：接入论文库、研报库、历史因子库和实验日志，打通假设生成、回测诊断、失败复盘与迭代优化。
全栈投研与评估治理阶段：能力延伸至因子筛选、组合构建、交易成本、风控与审计，推动自动化投研从“能生成”走向“可验证、可落地”。

LLM因子挖掘的价值在于提升投研流程效率和研究资产复用效率，推动候选因子进入生命周期管理，并逐步实现因子全生命周期管理的标准化。机构落地应遵循“底层标准化、分阶段迭代、多层质控”的路径，逐步接入既有投研体系。

风险提示

模型幻觉和代码错误风险
数据泄漏和前视偏差风险
因子拥挤和过拟合风险
合规与权限风险
成本和落地不及预期风险

报告封面

点击免费查看完整报告

你可能感兴趣

金工专题报告 20260110：深度学习系列之一：AI重塑量化，基于大语言模型驱动的因子改进与情绪Alpha挖掘

东吴证券2026-01-10

大类资产配置量化模型研究系列之七：宏观因子资产配置框架的改进

金融国泰君安证券2024-03-28

大类资产配置量化模型研究系列之四：基于宏观因子的大类资产配置框架

国泰君安证券2023-06-15

宏观固收量化研究系列之（九）：基于神经网络模型的利率择时

东方证券2023-03-12

量化研究参考系列之一：QuantaAlpha：用大模型做量化因子挖掘

信息技术东方证券2026-04-07

量化研究参考系列之五：Kronos：基于K线预训练的金融基础模型

文化传媒东方证券2026-05-18

衍生品系列研究之（九）:商品市场宏观风险因子模型初探

东方证券2017-12-13

因子与指数投资揭秘系列十七：螺纹钢基本面量化及数据分析的研究框架

国泰君安证券2024-04-09

因子与指数投资揭秘系列十六：铁矿石基本面量化及数据分析的研究框架

国泰君安证券2024-03-15

因子与指数投资揭秘系列十八：热轧卷板基本面量化及数据分析的研究框架

国泰期货2024-06-27