行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

RD-Agent实测：AI驱动的因子挖掘框架

2026-05-20 叶尔乐国联民生证券 Elise

RD-Agent实测：AI驱动的因子挖掘框架

RD-Agent是什么？

RD-Agent是微软亚洲研究院开源的“AI驱动研发自动化”框架，核心是让大模型扮演量化研究员，自主完成因子研究闭环。其方法论由“研究R”与“开发D”两类智能体构成，量化方向提供fin_factor、fin_model、fin_quant、fin_factor_report四个场景。本报告实测对象为fin_factor，仅挖掘因子、模型固定为LightGBM。框架以微软Qlib作为“量化基础设施底座”负责数据、回测与绩效计算，整体须运行于Linux环境，Windows用户需经WSL部署。

因子挖掘完整流程

RD-Agent将每轮因子研究抽象为“假设生成→任务分解→代码实现→执行回测→反馈生成”五步循环进行广度优先挖掘。

假设生成：依靠双层Trace注入，兼顾研究全局视野与即时纠错。
任务分解：将假设翻译成可执行的因子任务列表，明确给出名称、类型描述、LaTeX数学公式与变量解释。
代码实现：CoSTEER引擎以最多10轮“写代码—测试—修正”自动调试，并借助成功案例库与失败修复库两个向量知识库做RAG检索，提升首次生成成功率。
执行回测：在隔离Conda环境中逐因子运行，与Alpha158的158个量价特征合并送入LightGBM。
反馈生成：以极宽松门槛（IC的任何微小提升）推动渐进式进化。

RD-Agent运行评测

实测共完成36个有效Loop，组合双周频IC提升至0.07，AI自主挖掘因子的可行性得到验证。数据底库为Wind A股5792只股票、165个字段，财务数据全部按时点对齐（PIT）防止前视偏差。LLM调用中GLM-V5.1全面优于DeepSeek-V3.2，后者频繁陷入无限重复输出、行业截面因子多个提案全部编码失败，印证了代码工程能力比单纯推理能力更关键。36个Loop共触发11次SOTA更新，最终SOTA因子库以交叉/交互、盈利质量、分析师预期、现金流四类因子为主力贡献；但组合ICIR的提升始终弱于IC，机器学习类因子在激进参数下过拟合明显。

优劣势总结与展望

优势：

因子研究效率显著提升，可达人工的数十倍。
自动发现人类盲区。
累积式学习机制。
完整的实验溯源。
多数据源整合能力。

劣势：

运行稳定性差。
LLM代码质量不稳定。
IC目标与实际收益脱钩。
大模型对细节的处理仍待补充。

推荐场景：新数据源因子潜力的快速探索与现有因子库的增量补充。

优化方向：

Prompt注入更多注意事项。
多目标优化。
引入另类数据。
迭代更强的代码生成模型。
改进内存管理与计算效率。

风险提示

量化结论基于历史统计，未来市场环境变化可能导致失效。
LLM生成代码存在错误的风险，模型也有过拟合风险。
LLM挖掘因子具有一定随机性，不保证可再次按顺序挖到。

RD-Agent实测：AI驱动的因子挖掘框架 glmszqdatemark2026年05月20日 RD-Agent是微软亚洲研究院开源的“AI驱动研发自动化”框架，核心是让大模型扮演量化研究员、自主完成因子研究闭环。其方法论由“研究R”与“开发D”两类智能体构成，量化方向提供fin_factor、fin_model、fin_quant、fin_factor_report四个场景，本篇报告实测对象为fin_factor，仅挖掘因子、模型固定为LightGBM。框架以微软Qlib作为“量化基础设施底座”负责数据、回测与绩效计算，整体须运行于Linux环境，Windows用户需经WSL部署。分析师叶尔乐执业证书：S0590525110059邮箱：yeerle@glms.com.cn RD-Agent将每轮因子研究抽象为“假设生成→任务分解→代码实现→执行回测→反馈生成”五步循环进行广度优先挖掘。假设生成依靠双层Trace注入，兼顾研究全局视野与即时纠错；代码实现引擎CoSTEER以最多10轮“写代码—测试—修正”自动调试，并借助成功案例库与失败修复库两个向量知识库做RAG检索，显著提升首次生成成功率；执行回测在隔离Conda环境中逐因子运行，与Alpha158的158个量价特征合并送入LightGBM；反馈环节以极宽松门槛（IC的任何微小提升）推动渐进式进化。基础模型LightGBM凭借GOSS、EFB两项算法创新兼顾训练速度与精度。相关研究 1．量化专题报告：因子布阵手册：从“盲打”到“精准”的分域选股实战-2026/05/182．基金分析报告：聚焦AI硬科技：广发中证港股通信息技术综合ETF配置价值分析-2026/05/173．量化周报：短期抛压不改上涨趋势判断-2026/05/174．量化专题报告：AI读年报：20维解读2025年A股年报-2026/05/135．量化周报：继续保持乐观-2026/05/10 实测共完成36个有效Loop，组合双周频IC提升至0.07，AI自主挖掘因子的可行性得到验证。数据底库为Wind A股5792只股票、165个字段，财务数据全部按公告日PIT对齐以防前视偏差。LLM调用中GLM-V5.1全面优于DeepSeek-V3.2，后者频繁陷入无限重复输出、行业截面因子多个提案全部编码失败，印证了在本场景下模型的代码工程能力比单纯推理能力更关键。36个Loop共触发11次SOTA更新，最终SOTA因子库以交叉/交互、盈利质量、分析师预期、现金流四类因子为主力贡献；但组合ICIR的提升始终弱于IC，机器学习类因子在激进参数下过拟合明显。综合实测，RD-Agent宜定位为“具升级潜力的辅助因子研究工具”，效率可达人工的数十倍，但暂不能替代传统研究流程。核心优势在于因子研究效率显著提升（预估有效因子产出约900个/月）、自动发现人类盲区、累积式学习、完整的实验溯源与多数据源整合能力；劣势在于运行稳定性差、LLM代码质量不稳定、IC优化目标与实盘收益脱钩、对A股特殊机制与前视偏差等细节把握不足。我们建议优先将其用于新数据源因子潜力的快速探索与现有因子库的增量补充，并可通过Prompt注入领域知识、多目标优化、引入另类数据、迭代更强代码模型等方向持续改进。风险提示：量化结论基于历史统计，如若未来市场环境发生变化不排除失效可能；LLM生成代码存在错误的风险，模型也有过拟合风险；LLM挖掘因子具有一定随机性，报告中得到的因子仅代表单次运行结果，不保证可再次按顺序挖到。目录 1 RD-Agent是什么？................................................................................................................................................31.1项目功能与特点..................................................................................................................................................................................31.2系统架构与部署..................................................................................................................................................................................52因子挖掘完整流程....................................................................................................................................................82.1五步循环架构......................................................................................................................................................................................82.2 LightGBM与Alpha158.................................................................................................................................................................143 RD-Agent运行评测.............................................................................................................................................153.1数据管线与回测设置.......................................................................................................................................................................153.2 LLM对比：GLM-V5.1vsDeepSeek-V3.2..................................................................................................................................153.3各轮次IC提升表现..........................................................................................................................................................................163.4 SOTA因子库特征与关键驱动因子................................................................................................................................................174优劣势总结与展望.................................................................................................................................................194.1核心优劣势........................................................................................................................................................................................194.2推荐场景与优化方向.......................................................................................................................................................................205风险提示..............................................................................................................................................................21插图目录..................................................................................................................................................................22表格目录..................................................................................................................................................................22 1RD-Agent是什么？ 1.1项目功能与特点传统因子研究高度依赖研究员的经验积累与试错节奏，单人月产因子规模有限，且优秀因子的发现往往与个人知识结构强相关，难以系统化复用。本篇研究中我们以微软亚洲研究院2024年开源的研发自动化框架Research&DevelopmentAgent（RD-Agent）为核心工具，实测大语言模型能否扮演量化研究员的角色，自主完成“提出假设—实现因子—回测验证—迭代改进”的完整闭环。 RD-Agent的技术报告于2025年5月发布：《R&D-Agent: An LLM-AgentFramework Towards Autonomous Data Science》。其量化金融分支RD-Agent-Quant被NeurIPS 2025收录，根据团队公布的实测结果，在公开因子库基准上以约10美元/轮的运行成本实现了相对基线约2倍的年化收益率提升。截至本报告撰写时，项目已迭代至v0.8.0版本，累计提交超过1000次，是目前少数将“AI驱动的R&D自动化”在公开金融场景下系统验证过的开源框架。 RD-Agent的核心理念是把因子研究分解为一个可循环的研究链路：LLM读取已有实验记录后提出新假设，由代码自

点击免费查看完整报告