您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[IMF]:新冠疫情的影响:跟踪撒哈拉以南非洲经济活动的即时播报和大数据(英文) - 发现报告
当前位置:首页/行业研究/报告详情/

新冠疫情的影响:跟踪撒哈拉以南非洲经济活动的即时播报和大数据(英文)

金融2021-05-01IMF老***
新冠疫情的影响:跟踪撒哈拉以南非洲经济活动的即时播报和大数据(英文)

WP / 21/124COVID-19的影响:临近预报和大数据跟踪撒哈拉以南非洲的经济活动布兰登·比尔(Brandon Buell),陈慧珊(Carissa Chen),雷达·谢里夫(Reda Cherif),徐贤宰,唐佳文和尼尔斯·温特国际货币基金组织的工作文件描述了作者正在进行的研究,并发表以引起评论并鼓励辩论。国际货币基金组织工作文件中表达的观点是作者的观点,不一定代表国际货币基金组织,其执行局或国际货币基金组织管理层的观点。 国际货币基金组织的工作文件描述了作者正在进行的研究,并发表以引起评论并鼓励辩论。国际货币基金组织工作文件中表达的观点是作者的观点,不一定代表国际货币基金组织,其执行局或国际货币基金组织管理层的观点。基金组织工作文件非洲部COVID-19的影响:临近预报和大数据跟踪撒哈拉以南非洲的经济活动由Brandon Buell,Carissa Chen,Reda Cherif,Hyeon-Jae Seo,Jiawen Tang和Nils Wendt1编写由Papa M. N’Diaye授权分发2021年4月抽象的COVID-19大流行强调了关于其不断发展的经济影响的详细,及时信息的迫切需求,特别是对于撒哈拉以南非洲(SSA),那里的数据可用性和缺乏通用的临近预报方法限制了采取协调一致的政策应对措施的努力。本文介绍了一套高频和细粒度的国家/地区指标工具,可用于即时预测GDP并跟踪SSA国家的经济活动变化。我们做出两个主要贡献:(1)展示替代数据变量(例如Google搜索趋势和移动支付)的预测能力,以及(2)实施两种类型的建模方法,即机器学习和参数因子模型,它们可以灵活地合并混合频率数据变量。我们提供了肯尼亚,尼日利亚,南非,乌干达和加纳的2019年第四季度和2020年第一季度GDP的临近预报结果,并认为我们的因子模型方法可以推广到对其他SSA国家,数据可用性有限和时限较短的GDP进行临近预报和预测。JEL分类编号:C53,C55,E37,F17,O11关键字:COVID-19;计量经济学建模;经济活动;国内生产总值Google搜索趋势;移动支付; NO2;临近播报;短期预测作者的电子邮件:acherif@imf.org; jiawen_tang@hks.harvard.edu; brandon_buell@alumni.harvard.edu; hseo@college.harvard.edu; cjchen@college.harvard.edu; nils.wendt@tum.de1我们感谢Karim Barhoumi和Massimiliano Marcellino的宝贵意见和建议。我们感谢IMF同事的慷慨支持:Diego Cerdeiro共享了重要的运输数据,Seung Mo Choi,Fuad Hasanov,Xingwei Hu,Vikram Singh和IMF研讨会参与者的周到反馈和讨论。我们也感谢南非国库和赞比亚银行的有益评论。感谢哈佛大学教授Jeffrey Frankel和Dan Levy的指导以及MPA / ID计划的学生的见解。我们感谢Franck Ouattara在数据采购方面的帮助。哈佛大学数据分析小组推动了这项研究合作,我们感谢黄杰瑞的协调支持。唐家文担任这项研究合作的项目负责人。所有错误都是我们自己的。 目录I.简介1II.数据源摘要2III.估算框架7A.机器学习方法7B.参数因子模型方法9IV.模型结果14A.机器学习模型预测14B.参数因子模型预测17C.参数因子模型经济活动潜在因子19D.按国家评估示范绩效21E.关于模型变量重要性的讨论25V.结论30附录I.机器学习模型补充材料32附录二。因素模型补充材料38附录三。补充可视化43附录四。数据来源和汇总说明45附录V.完整数据字典变量列表46表表表1.按频率和国家/地区划分的变量细分3表2.按国家/地区收集的Google趋势搜索条款摘要4表3. ML模型的时间范围,预测变量和观察计数9表4.参数因子模型的时间范围,预测变量和观察计数9表5.南非,肯尼亚和尼日利亚的机器学习模型训练和测试时间14表6. ML模型预测的GDP同比变化百分比-与实际值的比较16表7. QoQ GDP百分比变化的ML模型预测-与实际值的比较17表8.乌干达,肯尼亚和加纳的因子模型估计和测试期17表9. GDP同比变化的因子模型预测–与实际比较18表10. ML模型性能比较–南非22表11.机器学习模型性能比较–肯尼亚23表12. ML模型性能比较–尼日利亚23表13.参数因子模型性能比较–乌干达24表14.参数因子模型的性能比较–肯尼亚24表15.参数模型性能比较–加纳25表16.南非表现最佳的机器学习模型中最重要的变量26表17.表现最佳的尼日利亚机器学习模型中最重要的变量26表18.肯尼亚表现最好的机器学习模型中最重要的变量27表19.因子模型变量的重要性–乌干达28表20.因子模型变量重要性–肯尼亚29表21.因子模型变量重要性–加纳29表22.南非的机器学习模型变量列表32表23.尼日利亚的机器学习模型变量列表32表24.肯尼亚的机器学习模型变量列表33表25.数据字典-完整变量列表46 图表图1.按频率,国家和类型3列出的变量摘要图2.南非,尼日利亚和肯尼亚的Google趋势搜索字词时间序列5图3.撒哈拉以南非洲国家主要经济体的GDP同比变化百分比6图4.因子模型参数的最大似然估计13图5.南非的ML模型时间序列比较15图6.肯尼亚的ML模型时间序列比较15图7.尼日利亚的ML模型时间序列比较15图8. ML GDP同比变化百分比的ML模型预测16图9.乌干达的因子模型时间序列比较17图10.肯尼亚的因子模型时间序列比较18图11.加纳18的因子模型时间序列比较图12.每月潜在因子–乌干达19图13.每月潜在因子–肯尼亚19图14.每月潜在因子–加纳19图15.南非经济活动潜在因素的平滑均值20图16.南非随机森林回归的前20个最重要变量35图17.南非XGBoost回归的绝对值最高的前20个系数35图18.尼日利亚随机森林回归的前20个最重要变量36图19.尼日利亚XGBoost回归的前20个最重要的变量36图20.肯尼亚XGBoost回归的所有非零系数37图21.肯尼亚随机森林回归的前20个最重要变量37图22.乌干达GDP:自相关,部分自相关和正常的分位数-逐年季度分位数图国内生产总值 ..........................................38图23.肯尼亚GDP:自相关,部分自相关和正常的分位数-逐年同比量图国内生产总值 .................................................39图24.加纳GDP:同比GDP的自相关,部分自相关和正态分位数-分位数图40图25.乌干达残差:因子模型Pass 3(a)与Pass 3(b)的自相关和部分自相关比较残差 ...........................................41图26.肯尼亚残差:因子模型Pass 3(a)与Pass 3(b)的自相关和部分自相关比较残差 ...........................................41图27.加纳残差:因子模型第3阶段(a)与第3阶段(b)的自相关和部分自相关比较残差 ...........................................42图28.按国家划分的季度GDP同比变化百分比的相关矩阵43图29.象牙海岸,喀麦隆,加纳和乌干达 .......................................................................................................................43 征求意见稿-不用于分发1I.介绍关于基于撒哈拉以南非洲地区(SSA)国家的经济挑战的详细,及时的信息对于基于证据的决策至关重要,尤其是在COVID-19大流行迅速发展的背景下。数据限制给SSA中的国家实时评估经济活动提出了严峻的挑战。对于SSA国家,没有可用的高频数据中央存储库,可用的季度或年度宏观经济数据通常受到发布延误的进一步限制。此外,标准的宏观经济预测方法在合并具有不同频率和/或更新间隔的数据时具有最小的灵活性,这限制了预测的生产节奏,因此限制了临近预报模型的可用性。2在这种情况下,如何评估COVID-19大流行对撒哈拉以南非洲(SSA)经济活动的影响?本文通过(1)采购具有足够历史回溯期的新颖且相关的高频时间序列数据以进行统计预测,以及(2)实施机器学习(ML)和参数因子模型(FM)方法来构建此模型来回答这一问题。一套增强的国家/地区季度GDP预测模型和预测模型,这些模型可以推广到SSA地区的其他国家/地区。临近预报方法为决策者提供了一套数据驱动工具,以应对快速变化的情况。本文着重介绍撒哈拉以南非洲地区排名前9位的经济体,它们在2019年占该地区GDP的73%:安哥拉,喀麦隆,科特迪瓦(科特迪瓦),埃塞俄比亚,加纳,肯尼亚,尼日利亚,南非和乌干达.3除了组装包含350个总数据变量的高频数据集外,包括运输,移动支付和Google搜索趋势等替代来源,4本文还介绍了一种扩展的临近预报实施方法,该方法a)能够集成混合频率数据(即每天,每周,每月),并且b)具有灵活性以适应不同的变量更新时间范围(即,当新信息可用时,临近预报模型可以不断更新预测)。对于机器学习(ML)模型,我们重点关注尼日利亚,肯尼亚和南非-SSA地区最大的经济体中,数据可用性最高。对于参数因子模型(FM),我们重点关注乌干达,肯尼亚和加纳,以在数据可用性方面变化的样本上测试模型。肯尼亚的数据特别多,数量和观测值数量很多,而我们在加纳的数据在这两个方面都小得多。乌干达成为数据可用性方面的“中游国”,这两组模型都提供了对2019Q4和2020Q1的临近预报和短期预测,这些结果的结合提供了关于最合适的方法论的见解。根据数据可用性在其他SSA国家/地区应用。很少有人尝试估计非洲国家的临近预报模型。 Barhoumi等。 2020年(即将出版)表明,可以在撒哈拉以南非洲的许多国家成功实施基于机器学习的临近预报。先前关于撒哈拉以南非洲地区GDP临近预报的学术研究集中在南非。 Kabundi等。 Kabundi等人(2016年)使用动态因子模型为南非的实际GDP创建了一个临近预报。5 (2016)选择21个时间序列,涵盖实际变量(实际GDP增长,贸易,生产和需求),名义2 即时广播是指根据Domenico Giannone,Lucrezia Reichlin和David Small定义的当前,最近或不久的将来的预测,“即时广播:宏观经济数据的实时信息内容”,《货币经济学杂志》 55,第1期。 4(2008):665-76。3世界银行,《世界发展指标》(2019年)。4在350个总变量中,有110个是Diego Cerdeiro提供的运输贸易变量。5 Kabundi,Alain,Elmarie Nel和Franz Ruch。 “现在正在预测南非的实际GDP增长。”工作稿。南非储备银行,2016年2月。https://ideas.repec.org/p/rbz/wpaper/7068.html。 征求意见稿-不用于分发2变量(生产者和消费者价格指数)和财务变量(名义有效汇率和回购利率)。我们以Kabundi的研究为基础,加入了具有更长回溯期的其他高频变量,并将多种建模方法应用于其他撒哈拉以南非洲国家。 Martin(2019)对南非GDP的预测为我们将非参数模型应用于临近预报提供了依据,该预测将传统的VAR预测模型与机器学习模型进行了比较.6 Martin(2019)使用了15个预测变量,发现弹性网回归,随机森林,支持向量机和递归神经网络为南非GDP预测提供了希望。