您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[欧洲中央银行]:使用ChatGPT增强GDP即时预报:PMInews发布的新应用(英) - 发现报告

使用ChatGPT增强GDP即时预报:PMInews发布的新应用(英)

AI智能总结
查看更多
使用ChatGPT增强GDP即时预报:PMInews发布的新应用(英)

加布·J·德·邦特,孙毅桥银行(ECB)的观点。 欧洲中央银行工作论文系列第3063号摘要JEL分类 C8; E32; C22关键词聊天生成预训练Transformer,文本分析,零样本情感分析,采购经理人指数(PMI),即时预测GDP本研究涉及让ChatGPT根据PMI新闻稿对“活动情绪分数”进行分类。它探讨了该分数对欧元区GDP即时预测的预测能力。我们发现,PMI文本分数在GDP即时预测方面超越了ECB/Eurosystem工作人员预测和Eurostat首次GDP估计中所嵌入的内容。ChatGPT得出的活动分数在同时包含复合产出PMI扩散指数的回归中仍然保持其显著性。即使在考虑方法论差异、排除像大流行这样的非常规经济事件以及不同的GDP增长分位数的情况下,GDP即时预测也因PMI文本分数而显著提高。然而,ChatGPT分数增强GDP即时预测所带来的预测收益具有时间依赖性,因日历年而异。除了最后两年之外,由于两个基准的预测误差异常低,特别是首次GDP估计,取得了可观的预测收益,平均约为20%。 1 欧洲中央银行工作论文系列第3063号非技术性摘要主要有力的结果表明,将PMI文本得分提升到两个GDP即时预测基准上,显著提高了GDP即时预测的准确性。通过添加复合产出PMI扩散指数,在样本内并未获得类似的收益。普通最小二乘法、稳健最小二乘法和岭回归都表明,扩散指数对基准GDP即时预测没有价值增值,甚至反而反直觉地产生负面影响。即使考虑方法论差异、排除像疫情这样的异常经济事件,以及针对不同的GDP增长分位数,ChatGPT派生得分增强的GDP即时预测结果仍然成立。使用PMI文本得分增强GDP即时预测的样本外预测收益,与最近两年相比平均相差约20%,但它们强烈依赖于时间,随日历年变化。研究表明,PMI叙述和轶事中的定性见解提供了有价值的信息,可以补充数值数据,从而对实际GDP增长做出更全面的评估。本研究介绍了一种利用人工智能(AI),特别是ChatGPT,来提高欧元区国内生产总值(GDP)预测的新方法。传统的经济预测方法主要依赖于数值数据,例如工业生产和零售销售等硬数据,以及采购经理人指数(PMI)扩散指数等软数据。相反,本研究探索了将定性信息——来自PMI新闻稿的文本内容——整合到现有预测中的潜力。这项研究的独特之处在于它关注了PMI新闻稿中报告的故事情节、语气和轶事。ChatGPT被用于分析PMI新闻稿并生成活动情绪分数。这些分数量化了新闻稿中叙述和轶事所表达的活动情绪,范围从强烈扩张的活动到显著收缩的活动。然后,本研究将这些ChatGPT生成的活动分数整合到传统的GDP即时预测中,即对当前季度实际GDP增长的预测,以评估它们的预测能力。分析使用了两个难以超越的GDP即时预测基准,设定了极高的准确标准,即欧洲央行/欧元体系工作人员预测和首次GDP估计。第一个基准包括专家的判断,而第二个则依赖于统计方法,填补了首次GDP估计中大量的缺失统计信息。我们的研究结果意味着以下几点。它们证实了早期发现,即通过将定性数据源集成到传统模型中,可以增强经济预测能力。新的一点是,这项研究表明,只有两页文本,而不是例如数百万篇报纸文章,就足以提升现有的难以超越的基准。此外,这些发现在不同方法调整下的稳健性强调了AI在经济预测中的潜力。这项研究推动了AI驱动经济预测领域的发展,并为政策制定者、金融分析师和经济学家提供了新的实用工具,以更准确地预测GDP。ChatGPT的成功为进一步研究开辟了新途径,例如将类似的技巧应用于其他类型的经济文本,包括政策机构的预测报告。此外,这种方法还可用于探索其他地区或国家。 2 欧洲中央银行工作论文系列第3063号1 简介我们的现在casts分析考虑了两个欧元区实际GDP增长的竞争性基准nowcasts。第一个GDP现在casts基准指的是ECB/Eurosystem工作人员宏观经济预测中嵌入的实际GDP增长nowcasts,它包含了预测时点所有相关的实时信息,包括工作人员判断。考虑的第二个基准是Eurostat发布的第一份GDP数据。它反映了发布时所有可用的统计信息,包括处理仍然缺失信息的统计方法。我们的实证分析涉及两条文献线索。第一条是情感文本分析文献,该文献采用自然语言处理方法分析经济学和金融学的数字文本。Sharpe等(2023)展示了从绿皮书叙述中提取情感对美GDP的预测能力,得出结论认为这些叙述的语调传达了大量增量信息。类似地,Du等(2024)通过对褐皮书进行文本分析来探索其中的轶事。Barbaglia等(2022)构建情感指标来预测美季度GDP,Babii等(2022)报告了文本分析应用于美GDP即时预测的应用。Ashwin等(2024)报告了一项文本分析用于欧元区GDP即时预测。与这项欧元区研究形成对比的是所考虑的文本数据特意限定为欧元区采购经理人指数(PMI)的新闻发布。通过专门关注PMI调查,本研究利用了其时效性、全面性和国际认可度。De Bondt(2012年和2019年)报告了综合产出PMI指数对当前季度欧元区GDP增长具有强大预测力的确凿证据。PMI调查每月进行,提供近乎实时反映商业状况(包括活动)的快照。这些数据对即时预测极为宝贵,因为它捕捉了经济活动中最新的趋势和变化,而这些在其他经济指标中可能尚未显现。此外,PMI调查在全球范围内标准化,并在各国广泛采用,允许进行一致的跨国际经济状况比较和评估。这种普遍性确保了PMI数据不仅相关,而且可比,使其成为提升GDP即时预测的理想选择。本研究探讨了将基于ChatGPT的情绪活动分数整合到现有的国内生产总值(GDP)即时预测中。我们假设这些分数可以通过整合实时情绪数据来提高即时预测的预测精度,从而对GDP进行更全面和及时的评估。GDP即时预测在经济政策制定、金融市场和商业战略中发挥着至关重要的作用。传统的即时预测模型通常依赖于结构化的定量数据,例如工业生产和零售额作为硬数据的例子,以及调查作为软数据。然而,自然语言处理技术的出现,特别是像ChatGPT这样的大型语言模型,为提高GDP即时预测的准确性提供了新的机遇。ChatGPT的一个引人入胜的应用是它能够根据文本数据对经济活动进行分类,例如新闻报道、社交媒体帖子和财务报告。通过分析这些非结构化数据来源,ChatGPT可以生成基于情绪的活动分数,这些分数可以捕捉实时的经济情绪。这些情绪分数提供了潜在的增量信息,可以补充现有的GDP即时预测。其基本原理是,文本数据通常反映了公众和商家的即时情绪,这些情绪可能先于传统经济指标的可观察变化。 3 4欧洲中央银行工作论文系列第3063号下午2点PMI文本得分主要输入数据是标普全球发布的欧区PMI月度报告附带新闻稿。最新新闻稿,包括欧元区的,可以在标普全球发布网站上找到,参见https://www.markiteconomics.com/Public/Release/PressReleases欧元区的闪购PMI发布文本结构并非完全固定。多年来仅进行了少量更改。本文结构如下:第二节报告了ChatGPT对PMI新闻稿中活动的分类;第三节描述了PMI文本得分对欧元区GDP即时预测的预测内容;第四节总结。这项实证研究的主要经验教训是,通过Chat-GPT生成的文本分数增强现有的竞争性GDP预测,显著提高了其准确性。PMI文本分数在同时包含综合产出PMI扩散指数的回归中仍然显著。这不仅适用于普通最小二乘法(OLS),也适用于稳健最小二乘法和岭回归。PMI文本分数中的信息在扩散指数中已经嵌入的信息之外增加了价值。PMI文本分数对GDP预测的显著增强在各种方法论途径中保持稳健,排除了诸如疫情等非正常经济事件,并且适用于不同的GDP增长分位数。相对于两个基准的样本外预测收益是时间依赖的,因日历年而异。相对于两个难以超越的基准的预测收益平均约为20%,除最近两年外。由于基准的误差异常小,尤其是在首次GDP发布接近于零误差的情况下,最近两年的相对预测表现较差。然而,2023年和2024年的ChatGPT增强预测误差在绝对值上也较小。这些见解证实,文本数据显著提高了GDP预测的准确性(其中包括,Díaz Sobrino等人,2021年;Barbaglia等人,2022年;Ferrara和Simoni,2022年;Ashwin等人,2024年)。有趣的是,文本数据的量不一定是关键因素。我们证明,即使只有全球知名经济指标PMI的两页评论,也能有效地有助于准确的GDP预测。利用数百万篇文本,我们的方法是有意选择性的,专注于仅PMI新闻稿,类似于Du等人(2024)专注于仅一种美国出版物。第二部分的文献涉及GDP即时预测。Stundziene等人(2023)的全面综述强调了利用实时数据和替代指标来提高经济活动即时预测的预测准确性的重要性。此类指标的创新示例是使用基于卫星的夜间灯光数据,如Galimberti(2020)或Google搜索数据(Ferrara和Simoni,2022)所探讨的。此外,Basselier等人(2018)研究了GDP即时预测与定性调查之间的关系,特别强调了制造业PMI调查对欧元区GDP的预测价值,但降低了硬数据(如工业生产)对GDP即时预测的重要性。发现制造业PMI信息量很大,在各种指标中排名靠前。这项研究的缺点是未考虑综合产出PMI和服务业商业活动PMI,这可能会提供更准确的预测。 5欧洲中央银行工作论文系列第3063号时间。最新新闻稿的结构对于2008年以来的结构具有说明性,如下所示:两页文字处理关键发现、产出和需求、就业、价格、库存和供应链、展望,以及评论。评论部分反映了S&P Global对新的调查回应的评估。新闻稿以一页背景信息结束,描述了调查方法。主要媒体关注点是覆盖服务业和制造业的综合PMI的快速发布,但并非涵盖所有经济部门,例如,非私营服务和建筑业缺失。快速发布通常在相应月份的第三周发布,最终发布大约两周后,即下一个月的第一周。欧元区的快速综合产出和制造业PMI调查新闻发布从2008年1月开始,而最终服务业新闻发布从2008年9月开始。一个从2008年开始的样本具有覆盖多个完整商业周期的优势,包括全球金融危机、欧元区政府债务危机和新冠疫情的衰退。服务业PMI调查中向受访者询问的关键活动问题是“您的业务活动(单位)与一个月前相比是上升、下降还是保持不变”。对于制造业,相应的问题是关于产出。服务业活动在2008-2024年期间权重约为73%,而制造业产出占剩余的27%。欧元区服务业PMI基于从约2000家私营服务业公司组成的代表性样本中收集的原始调查数据。德国、法国、意大利、西班牙和爱尔兰的国家服务业数据被纳入其中。这些国家合计约占欧元区私营服务业产出的78%。欧元区制造业PMI从约3000家制造企业组成的代表性样本中收集。德国、法国、意大利、西班牙、荷兰、奥地利、爱尔兰和希腊的国家数据被纳入其中。这些国家合计约占欧元区制造业活动的89%。欧元区采购经理人指数(PMI)是一个广泛使用的经济指标,用于衡量当前经济状况的总体趋势。它基于对约5000家服务业和制造业公司代表性样本的采购经理进行的月度调查。调查询问经理们其业务的各个方面,包括生产、新订单、库存水平、未完成订单、供应商交货、就业和价格成本状况。当采购经理回答调查中关于其业务指标集的问题时,他们会明确说明在过去和当前月份之间是增加了、减少了还是保持不变。类别式回答被汇总成公开发布的扩散指数。除了类别式回答外,采购经理还可以在随附的文本框中提供进一步的解释。几乎每个类别式问题都伴有自由回答问题,要求说明回答的原因。此外,还有一个“一般备注”字段,受访者可以在其中填写任何一般性备注。其中一些文本回复会出现在PMI新闻发布中,为扩散指数提供背景信息,但除此之外不会公开发布。调查回复被转换为扩散指数,然后进行季节性调整。扩散指数的计算方法如下,其中 P 是总回复中回复的百分比数值,范围在 0 到 100 之间。扩散指数是汇总“上升”的简单加权平均值。 ∗∗∗(1)6欧洲