AI智能总结
2025年09月04日 证券研究报告/金融工程专题报告 报告摘要 分析师:王鹏飞执业证书编号:S0740525060001Email:wangpf@zts.com.cn 大模型对投研的编程辅助仍在探索期,常见于一次性小项目,缺乏在投研环境中可反复应用、具备持续价值的专业化工具。 中泰金融工程团队基于对当前AI编程工具能力的理解,设计了一套基于规则文件(Rules)驱动的智能工作流,并依托自行整理的WIND底层数据字典,搭建了完整的自动化回测框架,将“一句话”策略回测编程变为现实,真正实现“用一句话描述策略→依据数据字典自动连接底层库查数→筛选股票→形成持仓→回测→出结果”。只要是支持Rule的编程工具,如Cursor、AugmentCode、CodeBuddyAIIDE等均可部署此框架。 相关报告 1、《传统赛道分流,港股科技热度不减》2025-09-02 2、《哪些股票会被纳入A股重点指数》2025-08-31 我们设计的Rules重点在于如何将自然语言转化为准确查表和生成持仓,生成持仓后则再调用已有函数回测。中泰金工“一句话”自动回测框架主要有以下创新: 3、《【中泰金工】行业量价资金流周观点(2025.08.23)》2025-08-23 一、数据查表的精准获取 我们设计了标准化数据库查询接口,降低了大模型直接输出SQL语句的语法错误或数据库语法不兼容的概率。我们的标准化接口通过参数化查询的方式,将复杂的SQL构建逻辑封装在底层,大幅提高了数据读取过程的可读性和稳定性,同时将大模型的能力聚焦在最核心的任务上——数据表名和字段名的精确映射。 我们手动整理了自行整理的WIND底层数据字典,这个数据字典不仅包含了英文的表名和字段名,还提供了对应的字段定义、数据类型、单位信息等数据。利用AI工具的长上下文处理能力和工具调用功能,系统能够准确理解用户策略描述中提到的各种量价、财务指标等变量,并将其自动映射到对应的数据库表名和字段名。基于WDS数据字典的完整映射规则,确保表名和字段的准确性验证。 二、股票筛选的结构化 我们设计的工作流将重心放在如何生成标准化的持仓数据,这是量化策略从概念到实现的关键环节。在持仓构建方面,系统自动生成符合回测引擎要求的标准化数据格式,确保每个持仓记录都包含日期(date)、资产代码(asset)、权重(weight)三个核心字段,并能根据用户指定的调仓频率(日度、周度、月度、季度)自动生成相应的持仓序列。 三、“一句话”回测示例 以"小市值价值精选策略"为例,用户只需输入:"月频策略,我要沪深交易所中市值小于40亿的股票中,筛选出ROE和ROA都处在这个样本中前50%的股票,再从中选择PE最低的30个股票进行回测,时间范围是2020年至2025年8月"。 系统自动解析出关键要素:调仓频率为月度、股票池为沪深A股、筛选条件为市值小于40亿且ROE和ROA前50%、最终选择PE最低的30只股票。接着,系统通过查 询 表 和 字 段 名 ,通 过 标 准 化 接 口 分 别从AShareEODDerivativeIndicator和AShareFinancialIndicator等表格获取估值和财务等数据,自动完成月频调仓日期生成、多维度筛选、排序选股等处理逻辑。整个过程从自然语言输入到生成包含净值曲线、风险收益分析、详细持仓记录的完整回测报告仅需几分钟时间,快速检验idea的有效性。 风险提示:数据依赖风险,依赖WIND数据库的数据质量和完整性,数据异常可能影响回测结果准确性;模型局限性,所选AI模型解析复杂策略描述时可能存在理解偏差;本框架是辅助性工具,不构成投资建议。 内容目录 1.框架介绍.................................................................................................................32.Rules与数据映射...................................................................................................43.一句话回测示例:小市值价值策略........................................................................7风险提示...................................................................................................................10 图表目录 图表1:框架流程......................................................................................................3图表2:架构详图......................................................................................................4图表3:Workflow的Rules......................................................................................5图表4:工作流示意图..............................................................................................6图表5:字段定义示例..............................................................................................7图表6:小市值示例策略的流程................................................................................8图表7:Cursor运行过程..........................................................................................8图表8:AugmentCode运行过程............................................................................9图表9:策略的表格输出...........................................................................................9图表10:策略的可视化输出...................................................................................10 大模型对投研的编程辅助仍在探索期,常见于一次性小项目,缺乏在投研环境中可反复应用、具备持续价值的专业化工具。 中泰金融工程团队基于对当前AI编程工具能力的理解,设计了一套基于规则文件(Rules)驱动的智能工作流,并依托自行整理的WIND底层数据字典,搭建了完整的自动化回测框架,将“一句话”策略回测编程变为现实,真正实现“用一句话描述策略→依据数据字典自动连接底层库查数→筛选股票→形成持仓→回测→出结果”。只要是支持Rules的编程工具,如Cursor、AugmentCode、CodeBuddyAIIDE等均可部署此框架,快速检验idea的有效性。 1.框架介绍 在日常研究中,投研人员既需要快速验证策略假设,也需要可持续复用的生产级工具。为弥合“自然语言——结构化数据——标准化回测”之间的鸿沟,我们以“最小可依赖接口”为设计原则,构建了: ①规则文件(Rules)驱动的智能工作流②标准化数据库查询接口③基于WDS数据字典的“表/字段/单位/定义”全量映射与校验④标准化持仓数据规范(date/asset/weight)与多频回测引擎 下图展示了我们设计的框架流程,实现了“用一句话”描述策略,即可生成可回溯、可复用的标准化回测代码、结果与报告。 来源:WIND,中泰证券研究所 中泰金工“一句话”自动回测框架关键创新点有两方面,一方面是数据查表的精准获取:标准化数据库查询接口,采用参数化查询,封装复杂SQL构造,显著降低语法错误与不同数据库语法不兼容;使用WDS数据字典进行“中文描述→表/字段名”高精度映射,并校验单位、数据类型与字段定义。另一方面在于股 票筛选的结构化,以“生成标准化持仓数据”为核心,确保date/asset/weight三要素齐备;按用户指定的调仓频率(日/周/月/季)自动生成持仓时间序列。下图详细展示了自动回测框架的详细构成。 来源:WIND,中泰证券研究所 2.Rules与数据映射 Rules文件引导大模型的行为过程和边界,是这个框架的核心。我们定义了两个Rules文件,一个是工作流,一个是详细的映射规则等需要遵守的细节。具体来说,工作流明确策略要素提取模板(频率/股票池/筛选条件/排序与数量/期间/权重方式),规定数据字典作为“表/字段/单位”的唯一事实来源,要求产出必须是“标准化查询参数”和“标准化持仓”两类结构化对象。而细节Rules则规定如何映射、如何查表、如何统一单位等问题。 来源:WIND,中泰证券研究所 我们在框架中详细给出常用表个的数据字典:表名、字段名、字段定义、数据类型、单位信息等。 3.一句话回测示例:小市值价值策略 策略描述:“月频策略,我要沪深交易所中市值小于40亿的股票中,筛选出ROE和ROA都处在这个样本中前50%的股票,再从中选择PE最低的30个股票进行回测,时间范围是2020年至2025年8月。” AI编程工具则会依据Rules自动解析相关要素。①频率:月度;②股票池:沪深A股;③条件:市值<40亿;ROE、ROA位于样本内前50%;④排序与数量:按PE升序取前30;⑤区间:2020-01至2025-08经 过 查 询 数 据 自 定 , 确 定数 据 来 源 映 射关 系 :①估 值 与 市 值来 自于AShareEODDerivativeIndicator(字段:S_VAL_MV,S_VAL_PE);②财务指标来自于AShareFinancialIndicator(字段:S_FA_ROE,S_FA_ROA)。如果以图形表示,处理流程则如下图所示。 来源:WIND,中泰证券研究所 来源:WIND,中泰证券研究所 来源:WIND,中泰证券研究所 以上是展示的是从多个表取数并筛选股票的示例。 我们当前设计的框架,只要网络环境中可以连接上WIND底层库,并且基于支持Rules的编程工具,如Cursor、AugmentCode、CodeBuddyAIIDE等,均可实现“一句话回测”,快速检验IDEA的有效性。 风险提示 数据依赖风险,依赖WIND数据库的数据质量和完整性,数据异常可能影响回测结果准确性;模型局限性,所选AI模型解析复杂策略描述时可能存在理解偏差;本框架是辅助性工具,不构成投资建议。 重要声明 中泰证券股份有限公司(以下简称“本公司”)具有中国证券监督管理委员会许可的证券投资咨询业务资格。 本报告基于本公司及其研究人员认为可信的公开资料或实地调研资料,反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响。本公司力求但不保证这些信息的准确性和完整性,且本报告中的资料、意见、预测均反映报告初次公开发布时