行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

描绘央行行长思想的空间

2025-10-16 BIS Elise

本文探讨了机器学习嵌入技术在分析中央银行讲话数据集中所揭示的经济思想图景。该数据集由 BIS 维护，包含 1997 年至 2025 年间近 100 家中央银行近 1000 名官员发表的 19742 次讲话。研究不仅分析了任何时间点讲话的主题，还追踪了主题随时间的变化，揭示了自 1997 年以来，中央银行思维的焦点如何受到不断变化的政策挑战的影响。通过主题和时间解析嵌入，本文深入了解了经济思想如何通过全球中央银行的交流实践而形成。

主要发现：

全球交流景观分析：研究发现，中央银行讲话存在明显的区域聚类现象，主要按国家和地区进行聚类。亚洲中央银行和伊斯兰金融中央银行形成了独特的集群，表明了相似经济环境下的政策重点和交流模式。此外，具有相似特征的中央银行在向量空间中彼此靠近，例如亚洲中央银行集群集中在某个区域，而发达经济体中央银行则集中在另一个区域。
机构分析：以欧洲中央银行 (ECB) 为例，研究发现其交流内容主要分为三个主题区域：货币政策、金融稳定和货币联盟特定的市场一体化。此外，ECB 还逐步将结构性挑战的讨论纳入其交流组合，包括结构性改革、家庭不平等和财富以及气候变化，反映了其支持更广泛欧盟经济政策的次要目标。
主题分析：对 ECB 货币政策交流的深入分析表明，这些主题经常根据时间特征进行区分，主题表示通常包含特定的时间段。这表明 ECB 货币政策交流受到当前经济环境和政策体制的强烈影响。研究进一步发现，ECB 货币政策交流主题在时间上高度集中，反映了特定政策环境下的政策重点。
情感分析验证：为了验证所识别的时间主题集群是否与宏观经济状况相对应，研究进行了补充的情感分析。结果表明，主题集群确实反映了实质性的政策内容，而不是仅仅捕捉表面语言模式。

研究结论：

本文的研究结果表明，先进的 NLP 技术为分析中央银行交流的全球图景提供了强大的新工具。通过构建“中央银行思想空间”，可以揭示机构模式、政策重点和近三十年来货币政策话语的演变趋势。该方法为探索中央银行交流的多维性质提供了一个直观的界面，增强了全球、机构和主题层面的货币政策话语的透明度和理解。

映射央行家的思想空间由 Taejin Park、Fernando Perez-Cruz 和 Hyun Song Shin著货币与经济部 2025年10月 JEL分类：E52、E58、C55、C38 关键词：央行沟通、央行讲话、人工智能、主题建模；嵌入 BIS工作论文由国际清算银行货币与经济部的成员撰写，有时也由其他经济学家撰写，并由该行出版。这些论文涉及当前感兴趣的主题，具有技术性。本出版物中表达的观点是作者的观点，并不一定反映BIS或其成员中央银行的看法。本出版物可在 BIS 网站 (www.bis.org) 上获得。 © 国际清算银行 2025。保留所有权利。经说明出处，简短摘录可以复制或翻译。绘制央行家思想的空间本文探讨了通过中央银行讲话的综合数据集的机器学习嵌入揭示的经济思想图景。该数据集由瑞士国家银行维护，涵盖了1997年至2025年间跨越三十年的超过100家中央银行的近1000名官员发表的19742篇讲话。除了对任何时间点的讲话进行主题分析外，主题随时间的演变提供了对自1997年以来中央银行思考重点如何受不断变化的政策挑战塑造的见解。通过主题和时间解析嵌入，可以深入了解经济思想如何通过全球中央银行的沟通实践形成。为了证明其效用，我们进行了一系列分析，绘制了全球货币政策话语的图景。此外，我们构建了一个定量框架——称为“空间对中央银行家思想的研究\"—这揭示了制度模式，并突出了政策方法随时间的转变。 1 简介央行沟通是央行政策制定的有机组成部分，影响并引导市场行为与央行的评估相一致（Blinder等人 (2008)）。前美联储主席本·伯南克曾戏称“货币政策98%是空谈，2%是行动”，强调了央行行长言语在引导预期中的巨大作用（伯南克 (2015)）。研究人员将这一见解牢记于心，越来越多地利用自然语言处理（NLP）来系统地分析央行沟通。通过将讲话、会议纪要、新闻稿和其他文本转化为数据，研究人员可以量化政策制定者言语中蕴含的语气、主题和信号（例如，Hansen和McMahon (2016)；Gorodnichenko等人 (2023)）。分析央行沟通的方法随着自然语言处理技术的进步而发展。核心方法可以分为情感分析技术（测量通讯的语气或情感）（Pang和Lee（2008））和主题建模技术（识别讨论的主题或话题）（Vayansky和Kumar（2020））。通常这些方法会结合使用，以创建更丰富的文本衍生指标。早期研究通常依赖于人工编码或简单的词频指数。一种经典的方法是基于词典的情感分析，使用预定义的词表来衡量语气。例如，研究人员经常使用 Loughran 和 McDonald (2011) 的金融词典来量化政策文本中的正面或负面情感。虽然这类词典透明且易于应用，但它们忽略了上下文和语言的细微差别。后续研究引入了统计主题建模来揭示央行沟通中的主题。潜在狄利克雷分配 (LDA) (Blei 等人 (2003)) 成为一种标准工具，并被应用于央行讲话以识别常见主题。例如，Hansen 等人 (2018)使用主题建模来研究美国联邦储备委员会 (Fed) 沟通中的透明度。然而，这些模型以“词袋”的方式处理文本，忽略词序或上下文。它们会错过微妙的语言信号，其静态词汇使得捕捉新术语或变化的交流模式变得困难。近年来，经济学中的自然语言处理（NLP）采用了更复杂的机器学习技术。研究人员不再仅仅依赖预定义词典或词袋计数，而是开始利用预测模型和上下文嵌入来更好地捕捉语言的细微差别。一个里程碑是词嵌入的使用。早期的嵌入方法，如Word2Vec（Mikolov等人（2013））和GloVe（Pennington等人（2014）），学习了单词的密集向量表示，使研究人员能够测量语义相似性（例如，“inflation”在向量空间中接近“prices”）。央行研究人员在政策语料库上训练了此类模型，以便更细腻地映射“央行的语言”（Ahrens和McMahon（2021））。尽管有这些优势，但这些嵌入模型生成的静态向量会为每个单词分配相同的表示，而不管上下文如何，无法区分例如金融“bank”和河流“bank”。为解决早期方法的局限性，研究重点已转向基于transformer的模型，如BERT（Devlin等人（2019））。这些模型生成上下文嵌入，捕捉单词在特定句子语境中的含义，并且可以进行微调以用于情感分类等任务。经济学家已开始将BERT及其变体应用于货币政策文本。例如，Cai等人（2021）使用基于BERT的方法分析联邦公开市场委员会（FOMC）声明，而Petropoulos和Siakoulis（2021）将文本特征与XGBoost（Chen和Guestrin（2016））相结合，以预测央行沟通中的金融压力。 gentzkow 等人 (2019) 调查了经济学中的“将文本作为数据”方法，并确定了词嵌入是一项在经济学中未被充分利用的具有前景的前沿技术。这一预期确实已经实现，例如，feldkircher 等人 (2025) 识别了央行讲话中的广泛主题，分析了其演变，并考察了央行之间的议题领导力。此外，当今最先进的方法专注于开发针对央行语言独特特征的领域特定语言模型。例如，silva 等人 (2025) 采用微调语言模型对央行讲话的句子进行多维度分类——议题、沟通立场、情感和受众。类似地，gambacorta 等人 (2024) 通过在大量央行讲话和文件上重新训练语言模型，展示了领域专业化的价值，发现这些专业模型在处理央行术语和分类政策立场方面优于通用替代方案。除了分类任务，baumgärtner 和 zahner (2025) 表明，在央行文件上训练的领域特定嵌入可以预测货币政策冲击，并揭示偏离通胀目标语言的表述如何影响市场预期和政策决策。基于预训练大型语言模型（LLMs）如ChatGPT、Gemini或Claude的聊天机器人的近期出现，为总结和解读央行通信开辟了新的前沿。研究人员正在探索此类模型的零样本或少样本学习能力，以提取见解，而无需进行大量的特定任务训练。值得注意的是，Hansen和Kazinnik（2024）让ChatGPT“解读Fedspeak”，发现GPT-4能够以与人类专家推理非常相似的逻辑来分类美联储声明中的政策立场。类似地，Alonso-Robisco和Carbó（2023）在其央行数字货币（CBDC）讲话的研究中也得出了相似的结论。这表明LLMs能够捕捉到央行各种主题中前代算法可能遗漏的微妙信号。超越分类和总结，机器学习技术为可视化央行沟通和对比提供了新的方法。通过将讲话编码为高维嵌入，可以测量沟通之间的相似性并跟踪主题如何聚类。现代主题建模方法（如BERTopic（Grootendorst (2022)））利用此类嵌入来发现潜在主题。BERTopic使用LLM生成的嵌入将文档分组到集群中，然后采用基于类的TF-IDF方法（Salton and Buckley (1988)）识别每个集群的关键词。这种语境化方法比传统方法产生更连贯的主题，因为分组是基于语境语义相似性而不是仅仅基于词共现。这种基于变压器的主题建模可以灵活捕捉新相关的词汇（例如“量化宽松”或“加密资产”），并更好地分离密切相关主题，这得益于语境嵌入。此外，一旦演讲被表示为嵌入，研究人员可以将它们投影到低维映射中以进行直观的可视化，表示上下文相关的关係与人类知识更紧密地一致（Grand等人（2022年））。t分布随机邻居嵌入（t-SNE，van der Maaten和Hinton（2008年））和统一流形逼近与投影（UMAP，McInnes等人（2020年））等技术应用了针对可视化高维数据的非线性降维方法，通过保留局部关系。本文展示了如何应用自然语言处理方法来分析货币政策话语的全球格局。通过利用大型语言模型、上下文嵌入、主题建模和降维技术，我们构建了一个定量的“中央银行家思想空间”，以映射这一格局。我们的方法展示了现代自然语言处理如何揭示机构沟通模式、追踪政策演变以及识别中央银行中的新兴主题。产生的可视化结果为探索中央银行沟通的多维性提供了一个直观的模板，增强了学术研究和货币政策话语的实际理解。这项工作为将尖端文本分析应用于中央银行沟通提供了一种方法论蓝图。 2 数据构建与描述分析央行讲话的研究进展受限于全面、结构化且机器可读的数据集在历史上长期可供使用有限且零散的问题。近期的研究工作开始弥补这一差距——欧洲央行（ECB）现在以机器可读格式提供讲话。在国际清算银行（BIS），我们已汇编包含来自发达和新兴市场经济体超过100家中央银行讲话的数据集，为全球货币政策格局提供全面覆盖。该数据集涵盖自1997年以来的讲话，捕捉了包括金融危机、政策体系变革和非传统货币政策出现等近期经济史上的重要时期。我们对原始讲话数据补充了必要元数据及附加特征，以促进系统化NLP分析及跨机构比较。具体来说，我们通过增加全面的说话人元数据来扩充语料库，包括机构隶属关系和地理位置，从而促进针对特定机构的分析和跨经济体比较研究。此外，我们还加入了分层的说话人职位分类，使研究人员能够考虑由于说话人组织权威的不同而导致的交流的异质影响。2 为了提升分析的可访问性，我们用AI生成的标准化摘要、主题表示和预先计算的高维嵌入来补充数据集——这些我们在本文的应用中使用了。 2.1 数据收集和处理我们论文中使用的数据库包含19,742份独特的英文演讲文稿记录，这些记录由全球100多家中央银行的州长、副州长和高级官员在1997年1月至2025年3月期间发表。基于BIS数据集基础，我们实施了元数据丰富。为了提取关于发言者的全面信息，我们采用了多方面的方法。首先，我们使用官方机构网站编制了主要中央银行（包括但不限于美联储、欧洲央行、日本银行（BoJ）、英格兰银行（BoE）、印度储备银行（RBI）、南非储备银行、巴西中央银行）的高层央行官员及其任期列表，从而能够精确地将讲话归因于高级官员。其次，我们系统地处理了原始来源的元数据，通常包括讲话标题、简要描述和包含发言者信息的全文文本。这些元素被单独提交给LLM（OpenAI的GPT-4o，通过API在2025年5月访问）以结构化格式提取发言者详细信息。第三，我们利用语言模型的参数知识，通过提供发言者姓名和讲话日期来检索相应的机构隶属关系和讲话时的职位。我们随后整合了这三种独立的数据收集方法以确保鲁棒性。在大约97%的情况下，这些方法产生了一致的信息。对于剩余的3%出现差异的情况，我们进行了人工验证和纠正程序。 2.2 描述性统计该数据集包含每段演讲的URL、标题、描述、日期、全文、标准化摘要、发言人姓名、职位、机构隶属关系、ISO2编码地点、主题表示和预计算嵌入。语料库在2008年后显示出增加的密度，反映了全球金融危机后央行沟通的重视程度提升（图1a）。这一时间覆盖范围使得能够分析不同经济制度下沟通策略的演变，包括常规和非常规货币政策实施期、金融危机以及不同的通货膨胀环境，从而通过沟通渠道促进对制度性反应的比较分析。在全球100多家中央银行的通讯中，欧洲央行和美联储合计约占语料库的25%（图1b）。为了分析的连贯性，十二个联邦储备区被作为一个统一的机构来表示，而欧洲央行的讲话在代表其国家中央银行而不是超国家机构时，会排除官员的通讯。语料库包含约1000位独特中央银行官员的通讯。我们的方法考虑了个人在其职业生涯中担任多个职务的情况。演讲分布显示出显著的集中性，机构领导层中，前任欧洲央行行长让-克洛德·特里谢成为最活跃的沟通者（在我们的语料库中出现在478篇演讲中），其次是继任者马里奥·德拉吉（337篇），菲律宾中央银行（BSP）的曼多·M·泰朗科（272篇）和美联储的本·S·伯南克（253篇），如图1c所示。这些最频繁的沟通者都在2008年金融危机后担任过领导职务，突显了这一转折性事件如何将中央银行沟通转变为关键的政策工具。 3 方法论本节提供了分析方法

点击免费查看完整报告