您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:AI 赋能资产配置(二十二):大模型如何征服 K 线图? - 发现报告

AI 赋能资产配置(二十二):大模型如何征服 K 线图?

2025-11-10王开、陈凯畅国信证券朝***
AI智能总结
查看更多
AI 赋能资产配置(二十二):大模型如何征服 K 线图?

核心观点 策略研究·策略专题 Kronos模型作为首个专为金融K线数据设计的基础模型,成功解决了通用时间序列模型在金融市场中的适应性难题。其根本性突破在于,它将金融时序分析从传统的数值回归范式转向了语言建模范式。通用模型因金融数据信噪比极低、非平稳性强,且其训练语料中金融数据占比不足1%而表现不佳;而Kronos通过在大规模金融语料基础上预训练,实现了对市场动态的精准解读。 证券分析师:王开证券分析师:陈凯畅021-60933132021-60375429wangkai8@guosen.com.cnchenkaichang@guosen.com.cnS0980521030001S0980523090002 基础数据 中小板/月涨跌幅(%)8162.17/-2.60创业板/月涨跌幅(%)3208.21/-0.93AH股价差指数118.42A股总/流通市值(万亿元)97.42/89.51 在技术架构上,Kronos的核心创新在于其专有的“金融分词器”与“分层自回归建模”机制。分词器利用BSQ算法将连续的K线数据离散化为离散的Token,这一过程如同将市场波动转化为可被模型理解的“金融单词”。在此基础上,模型采用分层预测:首先预测代表市场大势的“粗粒度”标记,再在此框架下预测捕捉细节波动的“细粒度”标记,这模仿了“先战略、后战术”的专业投资决策流程,显著提升了计算的效率与模型的鲁棒性。 该模型在多项核心金融任务中展现出卓越的实战性能,验证了其作为专用模型的显著优势。实证数据显示,Kronos在价格预测任务中的RankIC较领先的通用时序模型提升了93%,波动率预测的平均绝对误差(MAE)降低了9%。在最终的策略回测中,由Kronos信号驱动的投资组合实现了21.9%的年化超额收益和1.42的信息比率,证明了其预测信号能够有效转化为优秀的投资绩效。 资料来源:Wind、国信证券经济研究所整理 相关研究报告 《估值周观察(11月第2期)-外弱内稳:能源强势,价值回归》——2025-11-09《价格全方位多维跟踪体系(2025.11)-成本高企与利润分化并存》——2025-11-07《中观高频景气图谱(2025.10)-上游企稳回升,中游分化修复》——2025-11-06《AI赋能资产配置(二十一)-从Transformer到Agent,量化投资实战有何变化?》——2025-11-04《估值周观察(11月第1期)-盈利修复,估值下挫》——2025-11-02 展望未来,Kronos所确立的“领域专用”路径为金融大模型的发展指明了方向。它的成功标志着从“通用智能”到“领域智能”转型的必要性。基于此架构,下一代模型有望进一步融合文本、基本面等多模态数据,并与强化学习等技术结合,最终演进为能够自主完成“感知-决策-执行-优化”全链路的智能投资体。 风险提示:结论受模型存在不确定性、数据质量、市场环境影响,本文不构成任何投资建议。 内容目录 一、LLM及TSFM在金融市场应用中的困境与破局....................................4二、kronos可将金融时序分析从数值拟合转向语言理解..............................5三、核心架构结构..............................................................6四、构建覆盖全球市场的金融大模型训练体系......................................8五、实战应用场景:多维度赋能投资决策.........................................10五、结论与展望...............................................................11风险提示.....................................................................13 图表目录 图1:主流时间序列基础模型预训练语料中金融数据占比........................................4图2:Kronos在多个量化金融任务中的综合表现。..............................................5图3:Kronos模型的两阶段框架..............................................................6图4:Kronos不同规模的模型配置............................................................9图5:不同数据集上生成模型的视觉对比......................................................9图6:基于不同模型生成信号的策略回测累计收益曲线.........................................10图7:Kronos模型波动率预测数据...........................................................11 一、LLM及TSFM在金融市场应用中的困境与破局 过去数年,以生成式AI为代表的大型语言模型技术(LLM)以其强大的数据处理能力,在自然语言处理、计算机视觉等多个领域取得了突破性进展。这一技术浪潮也延伸至时间序列分析领域,催生了一系列通用时间序列基础模型(TSFM)。这些模型如TimesFM、Moirai、Chronos等,试图通过“一个模型解决所有时序问题”的思路,在涵盖气候、能源、医疗等领域的庞大数据集上进行训练,以期获得广泛适用的时间序列分析能力。 然而,当这些通用分析方法应用于复杂的金融市场时却面临着显著挑战。在股价预测、波动率估算等核心金融任务中,这些通用方法的表现甚至不及那些针对单一金融任务设计的传统分析模型。这一现象的根源在于,金融时间序列数据与其他领域的时序数据之间存在着本质差异,这种差异构成了难以逾越的应用鸿沟。 这道质性鸿沟首先体现在数据极低的信噪比与尖锐的非平稳性上。通用时序数据如气温、用电负荷,其背后受相对稳定的物理规律支配,噪声可控,趋势可循。而金融市场价格的变化,是无数参与者基于不完全信息进行博弈的即时结果,充斥着大量无意义的随机波动,其背后的数据生成机制如市场制度、参与者结构、宏观环境则在不断漂移甚至突变。一个在2021年科技股牛市中有效的模式,在2022年的加息周期中可能完全失效,通用TSFM从平稳数据中学到的“归纳偏置”难以适应金融市场这种规则常变的动态本质。 更深层次的问题在于,主流时间序列模型的训练数据存在对金融领域的“结构性歧视”。论文研究发现,在公开的通用时间序列模型训练语料中,金融序列数据的占比普遍低于1%。这意味着,在模型庞大的参数体系中,仅有微不足道的部分被分配用于理解和建模金融市场特征。当模型面对K线数据中典型的波动率聚类、肥尾效应以及价格-成交量间复杂的非线性关系时,其分析能力与模型设计均难以以为继。这种数据偏见导致通用模型的输出往往停留在对历史趋势的平滑外推,无法敏锐捕捉市场情绪转换与流动性突变带来的关键拐点,而这恰恰是超额收益的核心来源。 投资的本质是在不确定性中对概率进行定价,而通用模型提供的“平均最优”解,在零和博弈特征显著的二级市场中实际价值相对有限。机构投资者真正需要的并非在所有市场环境下表现平庸的万能型分析工具,而是在特定市场状态中具备显著预测优势的专用分析方法。Kronos研发团队深刻认识到这一核心矛盾,放弃大而全的传统思路,专注打造专为金融领域设计的量化分析体系。这一精准定位确保了产品从设计之初就与实际交易需求高度契合。 总体来说,Kronos是针对金融k线序列专门设计的基础模型,目标是将高频、多变量的市场数据转化为可解析的“语言”,通过覆盖45个全球交易所、超过120亿条k线记录的大规模预训练中学习层次化表征,Kronos在价格预测、波动率估计和合成数据生成等任务中都优于TSFMs序列基础模型。例如,在价格序列预测任务中,Kronos的RankIC较领先TSFM提升了93%,波动率预测的MAE降低9%,合成数据生成保真度提高了22%。 二、kronos可将金融时序分析从数值拟合转向语言理解 Kronos的成功,源于其完成了一次关键的跃迁——将金融预测从数值回归转向语言建模的轨道。传统量化模型,无论线性或非线性,均在试图求解一个函数f:RT×D→RH×D,即从历史连续值映射到未来连续值,但是,此框架对噪声极其敏 感,且对未经历过的市场状态泛化能力差。Kronos的颠覆性思路在于引入一个编码过程,将连续空间ℝD的K线数据映射到一个离散的标记bt。预测任务因此被重构为:𝐀 其核心价值在于,模型不再追求精确预测具体数值,而是聚焦于识别并量化最可能出现的市场状态序列。这一设计显著增强了模型的抗干扰能力和适应不同市场环境的泛化性能。 与传统方法不同,Kronos采用离散化技术学习市场的状态转换规律,而非局限于短期价格波动的数值表现。这其实类似于分析师的决策逻辑——他们通常不预测具体点位,而是判断市场处于“牛市”、“熊市”或“震荡市”等状态,并据此再制定详细策略。 三、核心架构结构 核心架构结构(一):k线分词器(k-line tokenization) Kronos理论体系的第一支柱,是一个能够将连续市场数据高效、保真地离散化的分词器。其设计目标是在表达力与计算效率之间取得最优平衡。其内部流程如下图左侧所示。 资料来源:《Kronos:Afoundationmodelfor thelanguageoffinancialmarkets》.Shi,Y.,Fu,Z.,Chen,S.,Zhao,B.,Xu,W.,Zhang,C.,&Li,J.(2025).arXivpreprintarXiv:2508.02739,国信证券经济研究所整理 在Kronos模型中,分词器扮演着将连续市场数据翻译为模型可理解语言的关键角色。其核心是一个基于Transformer的自动编码器。具体而言,编码器首 先对输入的K线数据进行特征提取,将其映射为一个连续的特征向量。这一步骤可以理解为对当前市场状态进行高度概括,形成一个密集的数值表示。随后,论文在量化器中采用名为BSQ的创新算法,负责将上述连续向量转换为一段二进制代码。这个过程类似于给复杂的市场状态分配一个唯一的、离散的“ID”。 3.2量化:BSQ将价格模式转化为稳健的离散代码 BSQ的实现方式是通过学习一组能够捕捉金融数据典型特征的最优超平面,并通过判断特征向量相对于这些超平面的方位来生成二进制编码。与传统方法相比,BSQ对异常值具有更强的鲁棒性。在实战中,市场有时会出现出现闪崩、流动性瞬间枯竭等极端行情,这些异常点极易对模型的训练和稳定性造成干扰,但BSQ能够更稳健地处理这些极端值,确保生成的代码不会因少数异常波动而发生剧烈变化,从而提升了模型在真实交易环境中的可靠性。这为后续模型准确识别和依赖有效的价格模式奠定了基础。 3.3分层标记化:“先战略后战术”高效计算捕获复杂市场模式 为了精细刻画千变万化的市场行为,那么这个“ID”库就需要足够大,但这会带来难以承受的计算负担。例如一个20位的二进制代码能产生超过100万个可能的模式。若让模型每次都在百万量级的选项中进行预测,其计算成本对实际应用而言巨大无比。 而Kronos则创新地引入了分层标记化机制,采用“先粗后细”的两步法决策流程解决这一问题。它将一个完整的20位代码,拆解为一个10位的“粗粒度”(coursesubtoken)代码和一个10位的“细粒度”代码(finesubtoken)。模型首先预测代表大类市场状态的粗粒度代码,然后在此大类下,进一步