行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Nowcasting中的参数扩散：问题与途径——在中国实际GDP Nowcasted中的应用

信息技术 2025-11-05 国际货币基金组织苏吃吃

核心观点

本文探讨了在临近实时预测（nowcasting）中，如何解决参数激增问题。临近实时预测利用高频指标在官方数据发布前估计当前或最近的经济状况，但大量高频指标可能导致模型过拟合，降低预测精度。

研究方法

本文评估了三种解决参数激增问题的方法：

变量选择：使用调整后的逐步自回归积分移动平均模型（AS-ARIMAX）选择与目标变量经济意义相符、统计显著且能提高预测精度的变量。
机器学习（ML）正则化：使用岭回归、LASSO 和弹性网络等正则化技术，对与目标变量相关性较低的变量系数进行惩罚，从而提高预测精度。
降维：使用主成分分析（PCA）将原始变量转化为新的不相关变量，减少模型参数数量，并捕捉对预测最重要的信息。

数据和应用

本文使用 166 个月度指标，涵盖消费、企业生产、价格、外部环境、调查或前瞻性指标、房地产、金融变量、政府和对外贸易、交通运输等宏观经济领域，对中国 2007 年第二季度至 2019 年第四季度的实际 GDP 增长率进行建模。然后，使用滚动窗口回归方法估计模型，并使用 2020 年第一季度至 2023 年第一季度中国实际 GDP 增长率的伪样本外性能比较各种临近实时预测模型，包括桥梁方程、MIDAS、U-MIDAS、动态因子模型（DFM）以及机器学习技术（岭回归、LASSO 和弹性网络）。

研究结论

LASSO 方法在受到经济判断和符号限制的变量选择指导下表现优于其他模型，但简单的模型如桥梁方程结合 AS-ARIMAX 变量选择也能产生可靠的估计，其精度与 LASSO 相当。
AS-ARIMAX 变量选择方法在结合桥梁模型时表现最佳，而 PCA 方法在三种变量选择方法中表现最差。
机器学习中的正则化方法可以增强预测精度，并与经济判断和符号限制相结合，有效地补充变量选择。

关键数据

数据范围：中国 166 个月度指标，涵盖 1952 年 11 月至 2023 年 4 月。
样本外预测评估：2020 年第一季度至 2023 年第一季度中国实际 GDP 增长率。
主要指标：中国实际 GDP 增长率、消费、企业生产、价格、外部环境、调查或前瞻性指标、房地产、金融变量、政府和对外贸易、交通运输等。

预测即时业务中的参数泛滥：问题与方法对中国实际GDP的临近预报应用保罗·卡辛，飞·韩，艾薇·萨布加，谢静，张帆 WP/25/ 217 国际货币基金组织工作论文描述作者正在进行的研究，并发表以征求评论和鼓励辩论。国际货币基金组织工作报告中表达的看法是作者的观点，不一定代表国际货币基金组织、其执行董事会或国际货币基金组织管理层的态度。 2025OCT 国际货币基金组织工作论文能力建设研究所现在casting中的参数增殖：问题与方法——应用于现在casting中国实际国内生产总值由Paul Cashin、Fei Han、Ivy Sabuga、Jing Xie和Fan Zhang*撰写由纳坦·爱泼斯坦授权发行 2025年10月国际货币基金组织工作论文描述作者（们）正在进行的研究，并发表以征求评论和鼓励辩论。国际货币基金组织工作报告中表达的看法是作者的观点，不一定代表国际货币基金组织、其执行董事会或国际货币基金组织管理层的看法。摘要：本文评估了三种解决现在casts中参数激增问题的方法：(i) 使用带外生变量的调整步进自回归积分滑动平均(AS-ARIMAX)进行变量选择；(ii) 机器学习(ML)中的正则化；(iii) 通过主成分分析(PCA)进行降维。利用166个变量，我们使用滚动窗口回归，从2007Q2到2019Q4，应用这三种方法估计我们的模型。然后，我们对各种现在casts模型进行模拟外样本性能比较，包括Bridge、MIDAS、U-MIDAS、动态因子模型(DFM)以及机器学习技术，包括岭回归、LASSO和弹性网络，用于预测2020Q1至2023Q1中国年度实际GDP增长率。我们的研究表明，LASSO方法优于所有其他模型，但仅在变量选择受经济判断和符号限制时才是如此。值得注意的是，像Bridge这样的简单模型，使用AS-ARIMAX变量选择，产生的估计结果几乎与LASSO的可比，突出了有效变量选择在捕捉强信号中的重要性。工作论文 Nowcasting中的参数泛滥：问题与方法对中国实际GDP的临近预报应用由 Paul Cashin、Fei Han、Ivy Sabuga、Jing Xie 和 Fan Zhang 整理内容一、引言 ......................................................................................................................................................3 II. 标准临近预报技术 ................................................................................................................4 III. 参数增殖的方法 .......................................................................................................7 A.变量选择..................................................................................................................................7B.机器学习（ML）模型的正则化..............................................................................9C.使用主成分分析（PCA）进行降维........................................10 IV. 应用：COVID-19期间中国实际GDP的即时预测 ...............................................................12 A.数据准备..................................................................................................................................13B.方法论........................................................................................................................................15C.结果与评估.......................................................................................................................16 V. 结论 ....................................................................................................................................................23 参考文献.........................................................................................................................................................27 图示图1。模型性能：方法#1 AS-ARIMAX.............................................................................18图2. 模型性能：方法#2机器学习正则化...................................................................19图3. 模型性能：方法#3 PCA..........................................................................................20 表一、引言实时货币政策决策通常基于使用不完整数据对未来经济状况的评估。由于大多数数据，尤其是季度宏观经济数据（如国内生产总值GDP）会滞后发布并进行后续修订，因此评估当前时期的经济状况对央行来说是一项挑战性的任务。为解决此问题，现已引入即时预测技术，该技术利用高频指标，在缺乏最新官方GDP数据的情况下监测实时经济活动。现报是指在实际数据发布之前，利用部分可获得、实时、高频数据来估计经济、金融或其他动态变量的当前或近期状态的一种做法（参见Giannone等人2008年）。现报有助于填补最新官方统计数据（通常延迟数周或数月）和实时发展之间的信息差距，从而帮助决策者以最少的延迟监控经济。现报使用统计、计量经济学或机器学习模型来整合来自多个来源（如调查、金融市场或卫星图像）的数据，以生成目标变量的及时估计。当前季度由即时预测模型生成的数据对于政策制定至关重要，因为它们是长期预测模型（如半结构模型（包括季度预测模型（QPM）和动态随机一般均衡（DSGE）模型）的初始条件输入。1这些长期模型中宏观经济预测的准确性很大程度上取决于这些起始条件。实证研究表明，由于不确定性的累积，预测误差往往会随着预测期的延长而增加。即时预测模型（nowcasting）的输入可以增强近期和长期预测的可预测性（例如，Giannone等人，2004年；Armstrong，2002年）。即时预测（nowcasting）的实用性一个显著的例子出现在COVID-19大流行期间，这突显了对经济活动高频指标的系统性分析的需要。危机情况需要更高频率的信息，以便企业、市场分析师和政策制定者能够迅速做出决策。例如，在中国，2020年第一季度经济经历了数十年来的最大收缩。本季度的首次官方GDP增长估计仅在4月中旬公布。尽管这次发布比许多其他国家要早，但它仍然提供了有限但及时的信息来指导货币政策响应。因此，政策制定者依赖于其他易于获得的经济指标，导致2020年2月和3月期间货币政策显著宽松，以缓解COVID-19冲击的影响，而此时第一季度官方GDP数据尚未公布。2022年也发生了类似情况，由于中国各地实施封锁，第二季度GDP数据的发布被推迟。在这种情况下，采用系统的方法分析来自不同来源的各种高频数据，可以提供关于当前经济状况的及时有用信息，为政策制定提供参考。对GDP等宏观经济变量的临近预测通常是结合简单的计量经济学模型与定性判断来构建的。这些练习涉及分析大量的时间序列数据。在情况下例如，对于季度GDP而言，即时预测提供了一种统计框架，通过结合高频经济数据的最新发布（如月度甚至更高频数据）来估计当前经济状态。随着围绕这些高频变量叙述随着时间的推移而演变，该框架会相应更新，以反映对经济活动更准确的评价（Banbura et al., 2012）。虽然高频指标的可用性目前对即时预测有利，但在构建即时预测模型时必须谨慎行事，因为参数激增的问题可能会将更多噪声引入即时预测中。当信息集中存在大量变量时，就会产生一个相关的问题，即所谓的“维度灾难”。这种现象发生在模型包含的高频预测变量数量相对于观测值数量很大时。因此，参数激增会导致过拟合，即模型捕捉到噪声而不是数据中的基本模式，最终降低预测精度（Giannone等人，2008）。鉴于参数激增是一个重要问题，探索能够帮助区分信息变量与纯粹噪声的方法至关重要。本文提出了一种针对临近预报中参数激增问题的系统化方法，该方法结合了专家知识、变量选择方法、统计技术、机器学习算法和持续监控。本文结构如下：第二节介绍了临近预测流程和常用技术。第三节介绍了三种解决参数泛滥问题的方法。第四节将这些参数泛滥方法应用于新冠疫情期间对中国实际GDP的临近预测。它还进行了模拟样本外预测评估，以比较不同临近预测模型结合下各种方法的临近预测性能。第五节总结。 II. 标准临近预报技术在讨论参数扩散的方法之前，有必要概述构建短期预测工具时常用的技术和流程。这些短期预测技术包括标准模型到更复杂的模型，具体如下： ▪桥方程在桥梁方程中，高频指标被转换为目标频率（即GDP的频率，通常为季度或年度），并使用普通最小二乘法（OLS）回归来估计这些高频指标与GDP之间的历史关系——这通常被假定为线性。高频指标缺失值被预测，通常使用单变量时间序列模型，如自回归积分移动平均模型（ARIMA）。然后，解释变量使用求和或平均方法（Higgins, 2014）汇总到目标频率。换句话说，这种方法利用线性回归将一个或几个关键高频数据点所包含的信息与GDP的季度或年度增长率（例如，Klein and Soji, 1989）联系起来。这种方法可以用以下数学公式表示：设 푦 为低频（LF）目标变量（例如，季度GDP增长率），푥 为高频i (HF)指标，i = 1,...,j（例如，月度工业生产、调查数据等），根据其存量/流量性质被汇总到LF。这里t = 1,...,T表示季度时间，tm表示月度。β(L)q是i 拉格朗日算子L中的多项式，其中 훽(L)=훽+훽L+⋯+훽L，每个HF指标一个，其中 pi i0i 1i p iip 是滞后数，而 u 是一个 i.i.d. 误差项。在上面的示例中，目标频率t q是 𝑗i푡q按季度，但该模型可以每月重新估计。现时预测的构建方式为

点击免费查看完整报告

Nowcasting中的参数扩散：问题与途径——在中国实际GDP Nowcasted中的应用

核心观点

研究方法

数据和应用

研究结论

关键数据

你可能感兴趣

Nowscasting中的参数扩散：问题与途径——在中国实际GDP Nowscasted中的应用

Nowscasting中的参数扩散：问题与途径——在中国实际GDP Nowscasted中的应用（英）2025

全球经济金融问题研究：宏观审慎管理政策和资本管制措施在新兴市场国家跨境资本流出入管理中的应用及其效果,兼析中国在资本账户自由化过程中面临的资本流动管理政策选择

混合器驱动的高损耗赛道通道中的反流； CFD 研究及其在实际导频信道中的应用

国泰君安期货凯利公式在实际应用中的思考

早期行动的快速见解：大数据在基于影响的预测， Nowcasting 和灾后损害和损失评估中的作用

【研选】英特尔即将发布AI PC处理器，三星有望于2024年上半年发布AI手机，分析师看好AI在端侧的落地应用；中移动将成为公司实际控制人、公司有望从多维度实现与中移动的战略合作

区块链技术在保险领域的研究现状、应用趋势与问题分析

人工智能在国防领域的应用问题与展望

平稳工况下电力系统负荷特性参数辨识的内生性问题与工具变量估计方法

Nowcasting中的参数扩散：问题与途径——在中国实际GDP Nowcasted中的应用

你可能感兴趣

Nowscasting中的参数扩散：问题与途径——在中国实际GDP Nowscasted中的应用

Nowscasting中的参数扩散：问题与途径——在中国实际GDP Nowscasted中的应用（英）2025

全球经济金融问题研究：宏观审慎管理政策和资本管制措施在新兴市场国家跨境资本流出入管理中的应用及其效果,兼析中国在资本账户自由化过程中面临的资本流动管理政策选择

混合器驱动的高损耗赛道通道中的反流 ； CFD 研究及其在实际导频信道中的应用

国泰君安期货凯利公式在实际应用中的思考

早期行动的快速见解 ： 大数据在基于影响的预测 ， Nowcasting 和灾后损害和损失评估中的作用

【研选】英特尔即将发布AI PC处理器，三星有望于2024年上半年发布AI手机，分析师看好AI在端侧的落地应用；中移动将成为公司实际控制人、公司有望从多维度实现与中移动的战略合作

区块链技术在保险领域的研究现状、应用趋势与问题分析

人工智能在国防领域的应用问题与展望

平稳工况下电力系统负荷特性参数辨识的内生性问题与工具变量估计方法

混合器驱动的高损耗赛道通道中的反流； CFD 研究及其在实际导频信道中的应用

早期行动的快速见解：大数据在基于影响的预测， Nowcasting 和灾后损害和损失评估中的作用