邵泽志1余澄庆1,2李雨杰1,2王 飞1,2,*徐勇军1,2 (1. 中国科学院 计算技术研究所,北京100190;2. 中国科学院大学 计算机科学与技术学院,北京101408) 摘要不同场景下时序数据的异质性极大地影响了智能决策中时序预测算法的泛化性和有效性,对其应用构成了重要阻碍。时序预测大模型是解决这一挑战的重要技术。综合了时序预测领域的最新研究动态,从模态视角自上而下地探讨了时序预测大模型的 4 种实现思路:基于提示的方法、基于微调的方法、基于对齐的方法以及时序预测基础模型。梳理了时序预测大模型构建过程中的核心要素和可用技术。探讨了未来的重要挑战和研究方向。 关键词时间序列,大语言模型,基础模型,预测 引用格式邵泽志,余澄庆,李雨杰,等 . 决策智能中的时间序列预测大模型 [J]. 指挥与控制学报,2025,11(2):146-157DOI10.20278/j.jc2.2096-0204.2024.0146 Large Time Series Forecasting Model in Intelligent Decision-making: A Survey SHAO Zezhi1 YU Chengqing1, 2 LI Yujie1, 2 WANG Fei1, 2, *XU Yongjun1, 2 (1.Institute of Computing Technology, Chinese Academy of Sciences, Beijing100190,China;2.School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing101408, China) AbstractThe heterogeneity of time series data in different scenarios significantly impacts the generalization ability and effectiveness oftime series forecasting algorithms in intelligent decision-making, posing a major obstacle to their application. Large time series forecastingmodels are essential techniques to address this challenge. The latest research trends in the field of time series forecasting are integratedand four im-plementation approaches of large time series forecasting models are explored from a modal perspective from top to bottom:prompt-based methods, fine-tuning-based methods, alignment-based methods, and basic models for time series forecasting. Additionally,the core elements and available technologies in the construction process of large time series forecasting models are sorted out.Furthermore, the important challenges and research directions in the future are explored. Key wordstime series, large language models, basic model, forecasting CitationSHAO Z Z, YU C Q, LI Y J, et al. Large time series forecasting model in intelligent decision-making: a survey[J]. Journal ofCommand and Control, 2025, 11(2): 146-157 时序预测技术在智能决策中扮演着重要角色:通过分析和学习历史数据的模式,准确预测时空系统的未来态势,可以为复杂系统调度优化和智能决策提供关键支持。时间序列数据广泛分布于交通、电力、气象等多种时空系统中,记录了关键观测点或指标的状态变化,是反映这些系统演变趋势的关键数据资源。时间序列预测技术致力于通过分析和学习历史数据的模式,准确预测未来趋势。这种技术在智能决策中扮演着至关重要的角色:能够准确预测时空系统的未来态势,从而为有效的调度优化和智能决策提供关键支持。因此,深入研究时序预测技术对于战场态势感知、武器系统维护、战场环境监测等领域至关重要,可以显著提高决策的准确性和效率,为军事行动提供精确而有力的支持。www.jc2.org.cn 如自回归积分滑动平均(autoregressive integrated mov⁃ing average,ARIMA)[1]和指数平滑状态空间模型(ex⁃ponential smoothing state space model,ETS)[2],被广泛认为是可靠的工具,并在实际应用中得到了认可。随着深度学习技术的发展,研究者们开发了更为灵活和强大的模型,这些模型能够挖掘时间序列数据中的深层价值模式,从而显著提升预测的准确性,成为学术研究的新趋势。然而,基于深度学习的时序预测模型通常要求训练和推理阶段使用相同的数据集[3],这限制了它们的泛化能力。一方面,不同领域的时序数据常常展现出不同的模式,导致模型难以广泛泛化;另一方面,不同领域数据的质量参差不齐,如信噪比、历史数据长度以及预测数据长度等,进一步削弱了模型的跨领域可用性。在军事领域,这些问题尤为显著,因为军事应用涉及的场景多样(例如电力、气象、交通等),且具有高对抗性,数据分布漂移严重,这使得现有的时序预测算法面临挑战。 长期以来,基于统计模型的时间序列预测算法, 受到计算机视觉和自然语言处理领域中诸如视觉Transformer(vision Transformer,ViT)[4]、双 向 编 码 器 表 示Transformer(bidirectional encoder representa⁃tions from Transformers,BERT)[5]、生成式预训练Trans⁃former(generative pre-trained Transformer,GPT)[6]等预训练大型模型的启发,时序预测大模型日益受到学术界的关注,并被认为是一个充满潜力的研究方向[7]。这些模型的设计目标是解决数据模式异质、数据质量不一等核心挑战,从而开发出适用于所有领域的时间序列预测任务的通用模型,处理零样本或少样本情况下的预测,推动时序预测技术的更广泛应用和实践。然而,作为一个新兴领域,目前还缺乏针对时序预测大模型研究思路和可用技术的系统性分析。大多数现有的综述[8-11]主要关注于预训练的大语言模型(例如GPT[6]、LLaMA[12])在时序预测中的应用。在其他研究中,文献[13]通过“数据视角”对相关工作进行了分类和梳理,而文献[7]则通过“方法视角”对相关工作进行了区分。此外,先前的研究通常同时概述时间序列、空间数据(如轨迹)等多种类型的数据,而没有对时序预测任务进行深入挖掘。 2基于模态视角的文献分类 本章详细介绍了时序预测大模型的分类。根据对自然语言和时间序列模态的利用方式的不同,将相关工作分为4类:基于提示的方法、基于微调的方法、基于对齐的方法和时序预测基础模型。前三者基于大语言模型或其预训练权重,借用大语言模型在大规模自然语言数据上预训练得到的零样本、少样本推理能力,实现时间序列的通用预测。与之相反,时序预测基础模型则从头开始构建时间序列预测大模型。图1总结了这4类方法的关系。 本文专注于时序预测任务,全面分析了大量相关研究,采用自上而下和自下而上两种视角详尽地综述了时序预测大模型的设计思路和具体技术:1)自上而下的视角:采用“模态视角”来区分不同的研究思路,即根据对自然语言和时间序列模态的利用方式的不同对相关工作进行分类。2)自下而上的视角:梳理了时序预测大模型构建流程中的共性关键技术。两个视角结合,既给出了实现时序预测大模型的多种思路,也梳理了可选择的具体技术。此外,本研究还探讨了未来可能的重要研究方向。 2.1基于提示的方法 在基于提示的方法中,研究者直接利用大语言模型的推理能力,将时间序列作为文本或文本的一部分提供给现有的大语言模型。如何定义提示模板是这类方法的核心。PromptCast[14]是一项典型的基于提示进行时间序列预测的工作。该方法针对温度、电力、行人活动等场景设计了提示模板,并通过句子到句子的预测方式取得了令人满意的实验结果。此外,文献[15-16]进一步整合了时间序列数据、历史新闻信息、金融知识图谱等多模态信号,以实现可解释的金融时间序列预测。类似的方法也在许多下 游 任 务 中 得 到 应 用 ,如 兴 趣 点 预 测[17]、健 康 领域[18]、能源预测[19]、以及表格数据[20]等。www.jc2.org.cn 1重要定义 1.1数据定义:时间序列 时间序列可以被形式化定义为一系列按照时间顺序排列的数据点或观测值的集合。通常,一条长度为N的时间序列可以表示为一系列样本点:X={(t1,x1), (t2,x2), …, (tN,xN) },其中,ti是第i个时间片的时间戳,xi∈ ℝ是该时刻记录的实数值。这里ti通常是等间隔的时间点,但也可以是不等间隔的时间点。 然而,文献[21]指出现有大语言模型的分词方式在表示时间序列数据时存在一定的问题,即:大语言模型的分词器会将单个数字分解为不与正确数字语义对齐的标记,从而导致标记不一致问题,使得模型难以正确理解历史时间序列。为了解决这一问题,文献[22]提出在数字之间插入一个空格,并使用逗号在时间序列中分隔每个时间节点,以确保每个数字在分词过程中都是独立的。类似的思想也出现在文献[23]中。 1.2问题定义:时间序列预测 时间序列预测任务的定义是基于过去观测到的时间序列数据,对未来时间点的数值或状态进行预测。时间序列预测任务通过给定时间序列的历史数据{(t1,x1), (t2,x2), …, (tN,xN) },预测未来时间点{(tn+1,xn+ 1), (tn+ 2,xn+ 2), … }的数值。时间序列预测任务的目标是尽可能准确地预测未来的数值,以便在实际应用中进行决策制定、规划和优化。 基于提示的方法完全依赖于文本模态,并利用 等研究引入了更多针对时间序列的归纳偏置,以进一步提升性能。TEMPO将时间序列分解为趋势、季节和残差部分,并引入了类似记忆银行[27]的提示池机制,以应对时间序列的分布漂移。LLM4TS则设计了新的标记化模块,包括卷积层、可训练的位置编码和时间戳表征层,用于学习时间序列的多尺度信息。另外,LLM4TS还采用了RevIN[28]技术来解决分布漂移问题。TEMPO和LLM4TS都以预训练的GPT-2作为基础网络,并通过微调位置编码和层归一化模块,以及LoRA[29]技术微调多头自注意力模块来提升性能。另外,通过在微调过程中同时使用文本和时间序列,可以得到具备一定多模态能力的模型[30-31]。 在文本模态上预训练好的大语言模型来实现预测。此外,这些方法也可以通过指令微调方式来调整模型参数。其典型架构如图2所示。这类方法