您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[信达证券]:深度学习揭秘系列之三:用DeepSeek优化价量因子 - 发现报告

深度学习揭秘系列之三:用DeepSeek优化价量因子

2025-03-21于明明、周金铭信达证券@***
AI智能总结
查看更多
深度学习揭秘系列之三:用DeepSeek优化价量因子

周金铭金融工程与金融产品分析师执业编号:S1500523050003联系电话:+86 18511558803邮箱:zhoujinming@cindasc.com 证券研究报告 金工研究 2025年03月21日 周金铭金融工程与金融产品分析师执业编号:S1500523050003联系电话:+8618511558803邮箱:zhoujinming@cindasc.com 在因子优化方面,多数因子经DeepSeek优化后预测能力提升显著。测试的Alpha158因子集中,75%的因子RankIC均值提升,50%的因子RankIC均值达1.2倍提升,35%的因子RankIC均值有1.5倍提升;ICIR指标同样向好,众多因子ICIR提升且多倍提升的因子数量可观。从不同窗口期数据看,优化后的因子表达式普适性强。以波动率因子std20为例,多次改进中引入平均真实波幅ATR概念、成交量加权机制、EMA双重平滑及四维波动极值捕捉等,虽部分改进使RankIC均值有波动,但整体提升了因子选股效果。不过,部分因子如Beta20、min20等受限于原始计算逻辑,在优化过程中未呈现显著提升,揭示传统因子改进存在理论天花板。 ➢在因子生成上,从零生成因子较难达到理想效果,然而,站在成功案例基础上生成因子,效果显著。若从零开始,20次迭代生成的因子具备一定逻辑,但预测效果一般,ICIR未达预期。若给予DeepSeek部分预测效果尚佳的因子表达式作为参考,例如Alpha158原始及优化因子表达式与对应的IC统计量,则能够在较少的迭代次数内,生成5个ICIR在0.8以上且与样例因子相关性低的新因子。其中第一个有效因子通过捕捉量价协同增强效应,第二个聚焦量价共振强度维度,展现出较好的选股能力。 ➢组合维度对比发现,将优化后的Alpha158因子及新生成因子线性结合,使用Lasso模型合成因子,能提升选股能力。全A数据中,原始因子、增强因子、原始+生成因子及最终合成因子的RankIC均值和多头超额收益逐次提升。落地到中证800指增组合,原始因子叠加优化与新生成因子得到的复合因子,月频RankIC均值从9.01%提升至10%,ICIR从0.93提升至1.01,多头超额年化收益从7.05%提升至7.92%,年化信息比从1.63增强至1.89。 ➢综上,本文引入DeepSeek模型,通过构建“优化-验证-再迭代”框架,贡献了因子优化与因子生成的新思路,实现了大语言AI模型对量化研究的赋能。 信达证券股份有限公司CINDASECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编:100031 风险因素:结论基于历史数据,在市场环境转变时模型存在失效的风险。 目录 深度学习揭秘系列之三:用DeepSeek优化价量因子.....................................................................4一、Alpha158因子体系解析与优化框架..........................................................................................51.1、Qlib算子与Alpha158因子集概述...................................................................................51.2、动态交互框架:基于Prompt Engineering的因子优化流程设计...................................81.3、优化效果验证:RankIC的跨周期普适性与稳定性突破..............................................121.4、以波动率因子为例:洞察模型优化方向.......................................................................16二、从优化到创造:基于大语言模型的新因子生成范式.............................................................212.1、从零生成的困境:独立探索下的效率与效果瓶颈.......................................................212.2、案例驱动的突破:基于先验知识的低相关性因子挖掘...............................................24三、策略应用与组合绩效验证:复合因子在指增组合中的增益..................................................303.1、复合因子的收益增强:中证800中RankIC均值提升至11.03%................................303.2、指增组合的实战检验:月度800指增超额提升近1%.................................................34风险因素............................................................................................................................................37 表目录 表1:Alpha 158因子列表.................................................................................................................5表2:Qlib部分算子...........................................................................................................................7表3:原始因子与改进因子RankIC均值和ICIR..........................................................................12表4:不同因子类型下原始表达式与增强表达式RankIC均值...................................................15表5:Beta20原始因子与历次优化因子表达式及IC统计量.......................................................19表6:min20原始因子与历次优化因子表达式及IC统计量........................................................19表7:qtlu20原始因子与历次优化因子表达式及IC统计量........................................................19表8:历史模型生成的因子表达式与IC统计量...........................................................................22表9:从Alpha158生成的因子表达式与IC统计量......................................................................25表10:新因子与ICIR大于0.7的样例因子之间的相关性..........................................................27表11:新因子之间相关性...............................................................................................................27表12:原始合成因子与增强合成因子IC统计量.........................................................................30表13:原始合成因子与增强合成因子多头超额与收益波动比....................................................31表14:原始合成因子与原始+生成合成因子IC统计量...............................................................31表15:原始因子与原始+生成因子多头超额与收益波动比.........................................................32表16:各因子IC统计量.................................................................................................................32表17:各因子多头超额与收益波动比...........................................................................................33表18:原始因子与复合因子在中证800中IC统计量.................................................................34表19:原始因子多头组合收益波动绩效指标...............................................................................35表20:原始因子组合多头超额收益波动绩效指标.......................................................................35表21:复合因子多头组合收益波动绩效指标...............................................................................35表22:复合因子组合多头超额收益波动绩效指标.......................................................................35 图目录 图1:因子优化流程示意图...............................................................................................................9图2:std20原始因子与第一次改进因子累计RankIC..................................................................17图3:std20原始因子与第一次改进因子多头超额净值................................................................17图4:std20原始因子与第一二次改进因子累计RankIC..............................................................18图5:std20原始因子与第一二次改进因子多头超额净值..........................