2026年05月18日 报告发布日期 Kronos:基于K线预训练的金融基础模型 ——量化研究参考系列之五 刘静涵执业证书编号:S0860520080003香港证监会牌照:BSX840liujinghan@orientsec.com.cn021-63326320 研究结论 ⚫文献信息:本次分享的论文由清华大学多位学者联合撰写,作者均来自清华大学交叉信息研究院与自动化系。论文发表于国际人工智能顶级会议AAAI 2026(TheFortieth AAAI Conference on Artificial Intelligence, AAAI-26),标题为《Kronos:A Foundation Model for the Language of Financial Markets》Kronos:基于K线预训练的金融基础模型。 金融风洞:用相似历史行情合成个股收益序列:——量化研究参考系列之四2026-05-12高维环境下的最优因子择时:——量化研究参考系列之三2026-04-21SSPT:股票时序定制化预训练选股框架:——量化研究参考系列之二一2026-04-13QuantaAlpha:用大模型做量化因子挖掘:——量化研究参考系列之一2026-04-07 ⚫推荐理由:论文提出了一套面向金融时间序列的基础模型框架——Kronos。该框架并不是直接预测“明天涨跌”,而是先将K线转化为结构化的“市场状态序列”,再通过预训练学习市场走势如何演化。模型可在统一框架下完成价格预测、收益预测、波动率预测、K线生成和投资模拟等任务。其中,收益预测结果可以进一步转化为逐股票未来收益率预测,并通过截面排序形成选股信号,因此具备嵌入量化选股框架的应用潜力。 ⚫核心框架:Kronos的核心流程可概括为“先理解市场走势,再服务预测与选股任务”。1)数据离散化:将连续K线转化为粗粒度与细粒度token,使模型先识别趋势、波动和局部扰动等市场状态;2)自回归预训练:基于历史token预测未来token,让模型学习市场状态如何随时间演化;3)多任务统一建模:基于同一市场表示输出价格、收益、波动率和未来路径,其中收益预测可进一步用于股票排序;4)推理阶段增强:通过多次生成未来路径降低单次预测误差,使最终预测结果和排序信号更加稳定。 ⚫亮点分析:我们在量化研究参考系列《金融工程研究_SSPT:股票时序定制化预训练选股框架》中曾梳理过SSPT的核心思路,即通过股票代码分类、行业分类和移动均值预测等任务提升股票时序表征质量。Kronos与SSPT同属金融预训练路线,但进一步从“任务驱动预训练”走向“生成驱动预训练”:SSPT主要服务收益预测与选股,Kronos则通过K线离散化与自回归生成,构建统一金融基础模型底座,并覆盖价格预测、收益预测、波动率预测、K线生成和投资模拟等多类任务。结合东方证券自研DFQ-Diversify,Kronos可理解为“统一表示底座”,DFQ-Diversify则可进一步提升信号在分布变化下的稳健性。 ⚫实证结果:论文实验覆盖多个交易所与不同资产类别,其中生成任务可视化基于上海证券交易所15分钟频率数据,投资模拟进一步在中国A股市场开展。结果显示,Kronos在价格预测、收益预测、波动率预测、K线生成和投资模拟五类任务中整体优于多类主流基准模型;价格预测RankIC相较最强TSFM基线提升约93%,波动率预测MAE相较基准模型下降约9%,生成任务质量提升约22%。在收益预测任务中,Kronos对每只股票未来收益率进行预测,并在截面上计算IC与RankIC;在A股投资模拟中,论文基于逐股票预测收益进行截面排序并构建long-only组合,结果在年化超额收益和信息比率上均优于基准方法。 ⚫优化方向:面向A股量化研究落地,Kronos后续可从五个方向进一步优化:1)数据层:在OHLCVA基础上补充换手率、振幅、波动率等更贴合A股交易结构的衍生特征;2)下游映射:将模型隐含表示或预测收益更直接地转化为截面因子,用于选股排序和组合构建;3)稳健性增强:结合DFQ-Diversify等领域解耦框架,提升模型在风格切换和市场状态变化下的泛化能力;4)生成能力应用:将生成路径用于数据增强、情景模拟和策略压力测试;5)工程路径:优先复用离散化表示、自回归建模和推理采样等模块,逐步嵌入现有量化研究体系。 风险提示 1.量化模型基于历史数据分析,未来存在失效风险,建议投资者紧密跟踪模型表现。2.极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。 目录 1、文献信息:清华大学团队提出Kronos,于AAAI-26会议发布金融基础模型框架...............................................................................................................4 2、推荐理由:K线离散建模框架,实现统一预训练范式...............................4 3、核心框架:先理解市场走势,再统一服务预测与选股任务.......................5 3.1数据离散化:先把连续K线转化为可识别的市场状态..................................................63.2预训练建模:让模型先学习市场如何演化....................................................................73.3多任务统一建模:同一模型输出可转化为预测和选股信号...........................................83.4推理阶段增强:通过多次模拟未来路径提升信号稳定性...............................................8 4、亮点分析:从定制化预训练走向金融基础模型,推动时序表征学习进一步 4.1建模对象:从“价格序列”到“金融市场语言”...................................................................94.2预训练机制:从“任务驱动”到“生成驱动”.....................................................................104.3应用边界:从“服务选股”到“统一任务底座”.................................................................104.4信息处理方式:与DFQ-Diversify的互补关系............................................................104.5体系价值:从“预训练选股模型”走向“金融基础模型”...................................................10 5、实证结果:多任务验证预训练有效性,收益预测可直接服务选股排序....11 5.1论文实验设计与核心结论...........................................................................................115.2结果说明与可复现性 ...................................................................................................12 6、优化方向:结合A股市场特征,探索金融基础模型的本土化落地路径...14 6.1数据层:从通用K线建模走向更贴合A股市场结构的数据表达.................................146.2下游映射:从统一建模能力走向选股与配置任务的有效落地......................................156.3稳健性增强:结合领域解耦框架提升跨周期泛化能力.................................................156.4生成能力:从模型验证拓展至策略研究与风险分析工具.............................................156.5工程路径:从完整框架复现转向模块化落地...............................................................15 7、风险提示...............................................................................................15 图表目录 图1:Kronos多任务性能对比:统一预训练框架在预测与生成任务中显著领先...........................5图2::Kronos整体框架:从K线离散化到自回归预训练,实现统一金融建模底座...................6图3:K线Tokenizer结构:层次化离散表示实现连续市场信息编码............................................7图4:Kronos模型结构配置:不同规模模型参数与结构对比.......................................................8图5:Kronos主实验结果:在预测、生成与投资模拟任务中均优于主流方法............................12图6:生成分布对比:Kronos生成K线在结构与分布上更接近真实市场数据............................12图7:Kronos消融实验:离散表示与自回归建模显著提升预测性能...........................................13图8:词表规模影响:更细粒度离散表示提升重构与预测表现...................................................13图9:推理增强效果:多路径采样显著提升预测能力..................................................................14 量化投资行业前沿理论与技术迭代提速,海外顶尖量化研究成果中蕴藏着诸多可借鉴的新思路、新框架,为A股量化因子挖掘与策略研发提供重要参考。为此,我们推出量化研究参考系列报告,聚焦海外顶刊、预印本平台发布的量化领域前沿文献,通过深度拆解核心逻辑、实证结果与创新价值,结合A股市场特性及本土投研实践开展适配性分析,提炼可落地的优化方向与应用思路,为投资者提供专业、前沿的研究参考。本期为系列第三篇,重点解析一套面向K线数据的基础模型框架Kronos,探讨基础模型在金融数据预训练方面的应用。 1、文献信息:清华大学团队提出Kronos,于AAAI-26会议发布金融基础模型框架 本次分享的论文由清华大学多位学者联合撰写(Yu Shi、Zongliang Fu、Shuo Chen、Bohan Zhao、Wei Xu、Changshui Zhang、Jian Li等),作者均来自清华大学交叉信息研究院与自动化系。论文发表于国际人工智能顶级会议AAAI 2026(The Fortieth AAAI Conference onArtificial Intelligence, AAAI-26),标题为《Kronos:A Foundation Model for the Language ofFinancial Markets》K