您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国际货币基金组织]:Nowcasting中的参数扩散:问题与途径——在中国实际GDP Nowcasted中的应用 - 发现报告

Nowcasting中的参数扩散:问题与途径——在中国实际GDP Nowcasted中的应用

报告封面

预测即时业务中的参数泛滥:问题与方法 对中国实际GDP的临近预报应用 保罗·卡辛,飞·韩,艾薇·萨布加,谢静,张帆 WP/25/ 217 国际货币基金组织工作论文描述作者正在进行的研究,并发表以征求评论和鼓励辩论。国际货币基金组织工作报告中表达的看法是作者的观点,不一定代表国际货币基金组织、其执行董事会或国际货币基金组织管理层的态度。 2025OCT 国际货币基金组织工作论文 能力建设研究所 现在casting中的参数增殖:问题与方法——应用于现在casting中国实际国内生产总值 由Paul Cashin、Fei Han、Ivy Sabuga、Jing Xie和Fan Zhang*撰写 由纳坦·爱泼斯坦授权发行 2025年10月 国际货币基金组织工作论文描述作者(们)正在进行的研究,并发表以征求评论和鼓励辩论。国际货币基金组织工作报告中表达的看法是作者的观点,不一定代表国际货币基金组织、其执行董事会或国际货币基金组织管理层的看法。 摘要:本文评估了三种解决现在casts中参数激增问题的方法:(i) 使用带外生变量的调整步进自回归积分滑动平均(AS-ARIMAX)进行变量选择;(ii) 机器学习(ML)中的正则化;(iii) 通过主成分分析(PCA)进行降维。利用166个变量,我们使用滚动窗口回归,从2007Q2到2019Q4,应用这三种方法估计我们的模型。然后,我们对各种现在casts模型进行模拟外样本性能比较,包括Bridge、MIDAS、U-MIDAS、动态因子模型(DFM)以及机器学习技术,包括岭回归、LASSO和弹性网络,用于预测2020Q1至2023Q1中国年度实际GDP增长率。我们的研究表明,LASSO方法优于所有其他模型,但仅在变量选择受经济判断和符号限制时才是如此。值得注意的是,像Bridge这样的简单模型,使用AS-ARIMAX变量选择,产生的估计结果几乎与LASSO的可比,突出了有效变量选择在捕捉强信号中的重要性。 工作论文 Nowcasting中的参数泛滥:问题与方法 对中国实际GDP的临近预报应用 由 Paul Cashin、Fei Han、Ivy Sabuga、Jing Xie 和 Fan Zhang 整理 内容 一、引言 ......................................................................................................................................................3 II. 标准临近预报技术 ................................................................................................................4 III. 参数增殖的方法 .......................................................................................................7 A.变量选择..................................................................................................................................7B.机器学习(ML)模型的正则化..............................................................................9C.使用主成分分析(PCA)进行降维........................................10 IV. 应用:COVID-19期间中国实际GDP的即时预测 ...............................................................12 A.数据准备..................................................................................................................................13B.方法论........................................................................................................................................15C.结果与评估.......................................................................................................................16 V. 结论 ....................................................................................................................................................23 参考文献.........................................................................................................................................................27 图示 图1。模型性能:方法#1 AS-ARIMAX.............................................................................18图2. 模型性能:方法#2机器学习正则化...................................................................19图3. 模型性能:方法#3 PCA..........................................................................................20 表 一、引言 实时货币政策决策通常基于使用不完整数据对未来经济状况的评估。由于大多数数据,尤其是季度宏观经济数据(如国内生产总值GDP)会滞后发布并进行后续修订,因此评估当前时期的经济状况对央行来说是一项挑战性的任务。为解决此问题,现已引入即时预测技术,该技术利用高频指标,在缺乏最新官方GDP数据的情况下监测实时经济活动。 现报是指在实际数据发布之前,利用部分可获得、实时、高频数据来估计经济、金融或其他动态变量的当前或近期状态的一种做法(参见Giannone等人2008年)。现报有助于填补最新官方统计数据(通常延迟数周或数月)和实时发展之间的信息差距,从而帮助决策者以最少的延迟监控经济。现报使用统计、计量经济学或机器学习模型来整合来自多个来源(如调查、金融市场或卫星图像)的数据,以生成目标变量的及时估计。 当前季度由即时预测模型生成的数据对于政策制定至关重要,因为它们是长期预测模型(如半结构模型(包括季度预测模型(QPM)和动态随机一般均衡(DSGE)模型)的初始条件输入。1这些长期模型中宏观经济预测的准确性很大程度上取决于这些起始条件。实证研究表明,由于不确定性的累积,预测误差往往会随着预测期的延长而增加。即时预测模型(nowcasting)的输入可以增强近期和长期预测的可预测性(例如,Giannone等人,2004年;Armstrong,2002年)。即时预测(nowcasting)的实用性一个显著的例子出现在COVID-19大流行期间,这突显了对经济活动高频指标的系统性分析的需要。危机情况需要更高频率的信息,以便企业、市场分析师和政策制定者能够迅速做出决策。 例如,在中国,2020年第一季度经济经历了数十年来的最大收缩。本季度的首次官方GDP增长估计仅在4月中旬公布。尽管这次发布比许多其他国家要早,但它仍然提供了有限但及时的信息来指导货币政策响应。因此,政策制定者依赖于其他易于获得的经济指标,导致2020年2月和3月期间货币政策显著宽松,以缓解COVID-19冲击的影响,而此时第一季度官方GDP数据尚未公布。2022年也发生了类似情况,由于中国各地实施封锁,第二季度GDP数据的发布被推迟。在这种情况下,采用系统的方法分析来自不同来源的各种高频数据,可以提供关于当前经济状况的及时有用信息,为政策制定提供参考。 对GDP等宏观经济变量的临近预测通常是结合简单的计量经济学模型与定性判断来构建的。这些练习涉及分析大量的时间序列数据。在情况下 例如,对于季度GDP而言,即时预测提供了一种统计框架,通过结合高频经济数据的最新发布(如月度甚至更高频数据)来估计当前经济状态。随着围绕这些高频变量叙述随着时间的推移而演变,该框架会相应更新,以反映对经济活动更准确的评价(Banbura et al., 2012)。 虽然高频指标的可用性目前对即时预测有利,但在构建即时预测模型时必须谨慎行事,因为参数激增的问题可能会将更多噪声引入即时预测中。当信息集中存在大量变量时,就会产生一个相关的问题,即所谓的“维度灾难”。这种现象发生在模型包含的高频预测变量数量相对于观测值数量很大时。因此,参数激增会导致过拟合,即模型捕捉到噪声而不是数据中的基本模式,最终降低预测精度(Giannone等人,2008)。 鉴于参数激增是一个重要问题,探索能够帮助区分信息变量与纯粹噪声的方法至关重要。本文提出了一种针对临近预报中参数激增问题的系统化方法,该方法结合了专家知识、变量选择方法、统计技术、机器学习算法和持续监控。 本文结构如下:第二节介绍了临近预测流程和常用技术。第三节介绍了三种解决参数泛滥问题的方法。第四节将这些参数泛滥方法应用于新冠疫情期间对中国实际GDP的临近预测。它还进行了模拟样本外预测评估,以比较不同临近预测模型结合下各种方法的临近预测性能。第五节总结。 II. 标准临近预报技术 在讨论参数扩散的方法之前,有必要概述构建短期预测工具时常用的技术和流程。这些短期预测技术包括标准模型到更复杂的模型,具体如下: ▪桥方程在桥梁方程中,高频指标被转换为目标频率(即GDP的频率,通常为季度或年度),并使用普通最小二乘法(OLS)回归来估计这些高频指标与GDP之间的历史关系——这通常被假定为线性。高频指标缺失值被预测,通常使用单变量时间序列模型,如自回归积分移动平均模型(ARIMA)。然后,解释变量使用求和或平均方法(Higgins, 2014)汇总到目标频率。换句话说,这种方法利用线性回归将一个或几个关键高频数据点所包含的信息与GDP的季度或年度增长率(例如,Klein and Soji, 1989)联系起来。这种方法可以用以下数学公式表示: 设 푦 为低频(LF)目标变量(例如,季度GDP增长率),푥 为高频i (HF)指标,i = 1,...,j(例如,月度工业生产、调查数据等),根据其存量/流量性质被汇总到LF。这里t = 1,...,T表示季度时间,tm表示月度。β(L)q是i 拉格朗日算子L中的多项式,其中 훽(L)=훽+훽L+⋯+훽L,每个HF指标一个,其中 pi i0i 1i p iip 是滞后数,而 u 是一个 i.i.d. 误差项。在上面的示例中,目标频率t q是 𝑗i푡q按季度,但该模型可以每月重新估计。现时预测的构建方式为