您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [东方证券]:量化研究参考系列之四:金融风洞:用相似历史行情合成个股收益序列 - 发现报告

量化研究参考系列之四:金融风洞:用相似历史行情合成个股收益序列

2026-05-12 刘静涵 东方证券 亓qí
报告封面

报告发布日期 金融风洞:用相似历史行情合成个股收益序列 ——量化研究参考系列之四 刘静涵执业证书编号:S0860520080003香港证监会牌照:BSX840liujinghan@orientsec.com.cn021-63326320 研究结论 ⚫文献信息:本次分享的论文由香港科技大学(广州)与IDEA Research团队联合撰写,于2025年3月作为arXiv预印本发布,标题为《Financial Wind Tunnel:ARetrieval-Augmented Market Simulator》金融风洞:检索增强的市场模拟器。 ⚫推荐理由:针对量化模型训练数据稀缺的痛点,论文提出检索增强的扩散式市场模拟框架,以相似股票序列作为条件信号,在统一框架下支持多频率、跨市场与what-if情景合成,并配套自动策略优化器。与端到端预测模型不同,FWT生成多条可能的未来路径,作为下游模型的训练样本与压力测试素材,不直接参与交易决策。实证显示,合成数据对基础Transformer多空策略的样本外收益、夏普比率与最大回撤均带来明显改善。 高维环境下的最优因子择时:——量化研究参考系列之三2026-04-21SSPT:股票时序定制化预训练选股框架:——量化研究参考系列之二一2026-04-13QuantaAlpha:用大模型做量化因子挖掘:——量化研究参考系列之一2026-04-07 ⚫核心框架:1)检索模块:以目标股票过去250天收益序列为查询,按相关性检索16只最相近股票,共同构成条件信息。2)生成模块:Transformer骨干的条件去噪扩散模型,通过掩码自监督还原目标未来20天走势。3)应用模块:自动策略优化器支持模型级(超参、特征、架构搜索)与规则级(组合配置筛选)两类优化。4)灵活扩展:调整检索范围与条件即可切换至跨市场和what-if生成;原文并验证了跨频率迁移能力。 ⚫亮点分析:相较已有市场模拟研究,FWT有三点突破:1)将检索增强思路引入金融时序模拟,使生成过程具备明确的横截面参照;2)通过切换检索池支持跨市场生成,案例显示该框架具备学习港股2021年末流动性危机波动特征的能力;3)统一框架覆盖周频至tick五个频率,验证了跨频率迁移能力,并提出“市场排名”评估指标,弥补绝对相关性指标缺乏横截面参照系的不足。 ⚫实证结果:实证在A股市场进行,以CSI300成分股作为股票池,数据期2010–2024年。生成质量上,日频与小时频相关性分别达0.645与0.602,市场排名均超99%;跨市场场景相关系数达0.475、市场排名91.83%。下游增强上,基础Transformer多空策略叠加10倍常规模拟与10倍大波动模拟后,样本外年化收益从20.67%提升至28.46%,夏普比率从5.13升至6.32,最大回撤从-2.9%收窄至-2.2%。消融实验显示,去掉检索后相关性从0.645骤降至0.052,而更换生成模型架构(GAN、线性模型)影响远小于此,说明检索策略的贡献显著高于生成模型的选择。 ⚫改进方向:结合A股特性可从四个方向推进本土化落地:1)扩展检索条件,在收益相关性外纳入行业、市值、宏观状态等A股特色筛选信号,提升相似样本可靠性;2)构建跨市场检索池,系统性引入港股、美股历史极端行情,扩大压力测试覆盖面;3)将what-if情景库与因子择时、组合优化流程对接,用合成数据扩充高维优化的有效训练样本,缓解样本量不足导致的参数估计不稳;4)工程落地重点关注交易成本与流动性约束——原文策略换手率较高但未扣费,A股实盘需进一步评估净收益。 风险提示 1.市场模拟基于历史数据学习,对历史上未出现过的全新市场环境外推能力有限,建议持续跟踪模型表现。 2.论文训练数据为CSI300大盘股,对中小盘股、低流动性品种的相似股票检索可靠性下降。 3.跨市场生成案例仅提供单股票可视化,缺少大样本统计检验。 4.下游Transformer策略的夏普比率提升未扣除交易成本,考虑到每5天调仓1/4仓位的高换手率,实际净收益可能显著低于报告数字。 目录 1、文献信息:香港科技大学(广州)与IDEA Research联合发表于arXiv,2025年3月预印本........................................................................................4 2、推荐理由:检索增强驱动的扩散模拟器,统一多频率、跨市场与what-if情景生成...........................................................................................................4 3、核心框架:检索、生成与应用三模块构成可控市场模拟器.......................5 3.1整体架构:检索、生成、应用三模块依次串联形成统一流程........................................53.2检索模块:基于收益相关性检索相似股票序列,为生成提供条件信息..........................63.2.1查询序列的构造63.2.2相似股票的检索73.2.3条件信息的组装73.3生成模块:条件扩散模型通过掩码自监督建模未来序列...............................................83.3.1扩散模型的基本原理83.3.2训练阶段:在历史数据上学会识别噪声83.3.3部署阶段:由历史条件生成目标股票未来20天路径93.3.4骨干网络与超参数93.4应用模块:自动策略优化器将模拟场景用于参数优化与压力测试...............................103.4.1模型级优化(Model-Based Optimization)103.4.2规则级优化(Rule-Based Optimization)103.5评估指标:相关性、市场排名与下游投资指标共同检验生成质量...............................11 4、亮点分析:相较已有市场模拟方法的主要突破........................................11 4.1从点预测到多路径生成:从"估计一条确定曲线"转向"采样一批可能路径"..................114.2从无条件生成到检索增强条件生成:为生成过程提供明确的横截面参照....................124.3扩展能力与评估创新:覆盖多频率、支持跨市场并引入市场排名指标........................12 5、实证结果:多场景生成质量稳健,下游策略显著增强.............................13 5.1多频率生成与跨频率迁移:日频与小时频相关性最佳.................................................135.2跨市场与what-if生成:通过限定检索空间与提示条件实现定向场景合成..................14 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 5.3下游模型增强与消融实验:检索贡献显著高于生成模型架构......................................15 6、改进方向:贴合A股特性,多维度升级实现本土化落地.........................17 6.1拓展检索条件,融入行业、风格与宏观状态等A股特色筛选信号..............................176.2构建跨市场检索池,将港股与美股历史极端行情引入A股模拟..................................176.3系统化what-if情景库,支撑因子策略与组合层面的压力测试....................................186.4与下游量化研究流程联动,用合成数据扩充训练、验证与压力测试样本....................18 7、风险提示................................................................................................19 图表目录 图1:FWT整体流程——检索、生成、应用三模块依次串联.......................................................6图2:检索与条件输入的时间关系示意.........................................................................................7图3:扩散模型:加噪与去噪过程示意............................................................................................9图4:FWT生成路径的三类去向................................................................................................10图5:多频率生成质量汇总——日频与小时频相关性稳定突破0.6.............................................13图6:跨频率迁移学习——小时频预训练模型零样本迁移至周频后效果进一步提升...................14图7:跨市场案例——A股目标序列较好模拟了港股2021年末流动性危机波动模式.................14图8:四类what-if情景生成对比——生成方向按提示正确偏转.................................................15图9:下游Transformer策略累计收益曲线——合成数据增强后显著跑赢基准..........................16图10:消融实验——检索策略边际贡献远大于生成模型架构.....................................................16图11:超参数敏感性——生成质量对检索数量与扩散步数不敏感..............................................17 量化研究方法正从传统预测与回测框架,逐步延伸至生成建模、情景模拟与压力测试等更广的研究范式。围绕市场环境合成、极端行情复现与模型稳健性评估,近年相关研究开始为A股量化策略研发与风险管理提供新的工具与思路。为此,我们推出量化研究参考系列报告,聚焦量化领域具有代表性的前沿文献,通过梳理其核心逻辑、实证结果与方法创新,结合A股市场特性及本土投研实践,提炼可落地的应用启示。本期为系列第四篇,重点解读发表于arXiv的金融时序生成论文《Financial Wind Tunnel:A Retrieval-Augmented MarketSimulator》,讨论其如何通过检索增强与条件扩散相结合的框架,实现多频率、跨市场与what-if情景生成,并为下游量化模型提供训练增强与压力测试环境。 1、文献信息:香港科技大学(广州)与IDEAResearch联合发表于arXiv,2025年3月预印本 本次分享的论文由香港科技大学(广州)的Bokai Cao、Xueyuan Lin、Cehao Yang,以及粤港澳大湾区数字经济研究院(IDEA Research)的Yiyan Qi、Ch