经FSI主席Fernando Restoy授权。© 国际清算银行 2025年。保留所有权利。经说明出处,可摘录或翻译简短部分。国际清算银行(bis)金融稳定研究所(fsi)的工作人员编写fsi简报,有时与其它专家合作。它们是关于当前感兴趣的规定和监管主题的简短笔记,具有技术性。它们中表达的观点是它们作者的观点,并不一定是国际清算银行或巴塞尔标准制定机构的观点。ISSN 2708-1117 (在线) ISBN 978-92-9259-861-7 (在线)本出版物可在BIS网站(www.bis.org)上获取。如需联系BIS媒体与公共关系团队,请发送邮件至media@bis.org。您可前往www.bis.org/emailalerts.htm注册邮件提醒。 从基础开始:监督领域生成式人工智能应用盘点1. 简介高亮1杰瑞米·普雷尼奥(jermy.prenio@bis.org),国际清算银行。作者感谢参与调查的非正式科技创新网络成员;感谢萨利赫·阿尔卡里亚恩、萨米尔·基万和尼可·劳里德森的有益评论;以及感谢安娜·亨茨曼的行政支持。2参见 Crisanto 等人 (2024)。3参见 Prenio (2024)。•许多金融监管机构已经正在试验、开发或使用生成式人工智能(用于监督目的的生成式AI)应用。•金融当局试图利用新技术更高效地获取信息,但他们的生成式人工智能活动受到过时信息技术基础设施、数据安全问题和缺乏技术技能的阻碍。•大多数监督领域报告的生成式人工智能应用可以归为三类:(i)基本文档处理;(ii)知识管理;以及(iii)文档审查。大多数“在使用中”的应用属于第一类;开发工作分散在三类中;而实验集中在第二和第三类。•在将生成式人工智能应用整合到监管中时,识别出的主要挑战是用户接受度和提供信息的准确性。随着金融监管机构转向更复杂的生成式人工智能用例,这些挑战可能会加剧。本文概述了金融监管领域生成式人工智能应用现状,其基于对非正式监管科技网络所代表机构的调查,该网络由2022年引入一项生成式人工智能(gen AI)应用程序,推动了在金融领域利用该技术潜在益处的探索和实验热潮。这得益于新技术的可获取性,云服务提供商正扩展其服务以包含gen AI应用程序。虽然金融机构的gen AI应用案例主要集中在提高运营效率,但他们仍在不断探索其他潜在应用案例,据报道,他们正大力投资人工智能领域。从基础开始:监督领域生成式人工智能应用盘点1围绕生成式AI潜在益处的探索和实验并非局限于金融机构。生成式AI的发展也为金融监管机构利用创新技术辅助监管工作提供了实验素材,即所谓的监管科技(suptech)。一般来说,监管机构一直致力于探索能够帮助他们处理大量叙述报告及其他相关文本文档的应用。因此,多年来出现了许多使用自然语言处理技术的工具。生成式AI有潜力显著提升这些工具的能力。生成式AI还可能让监管科技应用对用户更加易于使用,从而解决将此类应用有效整合进监管流程所面临的挑战之一。3 12 22.回应调查的机构简介从基础开始:监督领域生成式人工智能应用盘点当局的通用人工智能活动来源:FSI。图1在42名受访者中,32人报告他们已经正在试验、开发或使用用于监督的生成式AI应用程序。在这些机构中,只有12家已经开始使用此类应用程序(图2)。比较来自AEs和EMEs的机构的生成式AI活动,调查结果显示,在每种类型的管辖权中,正在试验、开发和使用生成式AI应用程序的机构数量没有明显差异(图3)。2018年金融稳定研究所(FSI)作为一个信息交流和分享金融当局如何在金融监管中整合监管科技实践的论坛。该调查从2025年1月至3月进行,收到来自42个当局的回复。4在发达经济体 (AEs) 与新兴市场经济体 (EMEs) 几乎相当的代表基础上。受访者机构拥有不同的职责,包括银行监管、保险监管、反洗钱/打击恐怖融资 (AML/CFT) 以及证券市场监管(图1)。第2节概述了金融监管机构的生成式人工智能 (gen AI) 活动——即它们是否正在试验、开发或已使用生成式人工智能应用。第3节描述了监管中的生成式人工智能用例、感知到的益处、部署方式以及将其整合到监管流程中面临挑战。第4节总结。4参见附件1中受访者当局的名单。 5从基础开始:监督领域生成式人工智能应用盘点来源:FSI。来源:FSI。许多监管机构由于安全顾虑不愿使用云基础设施,这影响了人工智能的采用和人工智能的成熟度。例如,参见Gambacorta等人(待发表)。发达经济体(AEs)和新兴市场经济体(EMEs)的当局正在试验、开发或使用生成式人工智能受访者报告了其组织在试验、开发、使用甚至开始探索用于监督的生成式人工智能(Gen AI)应用方面所面临的几个挑战。受访者最常提及的挑战是过时的信息技术(IT)基础设施,5数据安全和缺乏技术 图3 3 4探索生成式人工智能(gen AI)应用的挑战3. 监管领域中的生成式人工智能应用场景从基础开始:监督领域生成式人工智能应用盘点来源:FSI。图4受访者被问及在哪些监管领域他们正在试验、开发或使用生成式人工智能应用。这些监管领域基于 Prenio (2024) 和Prenio 等人 (2024) 使用的分类。使用生成式人工智能应用的监管领域与当局积极部署监管科技工具的领域相同,但我们观察到在监管流程自动化方面有显著的集中(图5)。如同金融机构一样,金融监管机构似乎正在利用或希望利用生成式人工智能应用来提高运营效率。确实,调查结果显示了这一点,大多数受访者表示生成式人工智能应用为监管带来的好处是提高查找信息效率。鉴于对生成式人工智能模型中幻觉问题的担忧,一些受访者对生成式人工智能应用能够为他们提供更准确信息的乐观态度令人惊讶且有趣(图6)。技能。许多受访者还提到获取生成式人工智能技术的挑战。这可能涉及到将生成式人工智能应用程序更广泛地推广给监管人员所花费的成本。法律风险,尤其是在生成式人工智能应用程序使用公共领域数据时,以及可能因数据泄露(例如,当机密数据被无意或有意地输入到第三方应用程序中)而产生的法律风险,也是一个关注点。此外,一些机构仍然不清楚他们如何将生成式人工智能用于监管目的。 图5图6受访者还被要求描述他们目前正在实验、开发和使用的至少一个生成式人工智能应用。根据反馈,我们可以将大多数生成式人工智能监督应用分为三类:(i) 基本文档处理;(ii) 知识管理;(iii) 文档审查。大多数已经使用的生成式人工智 从基础开始:监督领域生成式人工智能应用盘点来源:FSI。具体用例示例能应用都属于第一类; 5 6•••从基础开始:监督领域生成式人工智能应用盘点知识管理以下为此类用例的示例:基础文档处理监管者,尤其是新入职的监管者,会花费大量时间寻找相关法规并了解监管变化。一家监管机构正在开发一款具有聊天界面的生成式人工智能应用,允许监管者轻松、透明地获取法规信息。该聊天机器人会回答法规相关问题,并提供其生成答案所使用的文档的参考文献和引文,从而消除其他聊天机器人中常见的“黑箱”现象。它还可以生成并建议后续问题,以及总结和比较法规。用户还可以按国家或地区法规进行筛选。因此,该应用将简化寻找相关法规和突出监管变化的过程,从而支持监管决策。另一个监管机构也在开发一个“知识边界”LLM聊天机器人,该机器人基于该机构的监管要求进行训练。该应用程序将允许监管人员检索包括准确引文的相关信息。用户将能够查询任何监管政策或要求,而无需知道精确的关键词。因此,该应用程序将促进监管人员对相关法规的理解,提高监管活动的准确性和效率。为减轻幻觉风险,开发过程包括创建一个稳健的知识库,该知识库结合了全面的语义排序技术和缩写词典。此外,采用思维链推理方法并实施当前正在使用的生成式人工智能应用主要侧重于辅助主管处理基础文档任务,例如起草和编辑检查报告、监督管理决策文件以及向监管对象发送的通信。这些应用也被用于总结、翻译或从相关新闻报道或监管提交文件中提取关键信息。这里,像ChatGPT、Microsoft Copilot、DeepSeek和Perplexity这样的公开可用的生成式人工智能工具被广泛使用。与上述类似,另一个监管机构正在使用大型语言模型(LLM)开发一个监管聊天机器人,该聊天机器人从包含所有相关法律和该机构法规的知识库中检索信息。目标是让监管人员能够通过提出有针对性的问题,快速准确地获取感兴趣的法规——包括其详细信息。该机构还在评估 Graph RAG 的使用,Graph RAG 是一种传统 RAG(检索增强生成)技术的增强版,通过结合知识图谱来实现。通过使用监管数据知识图谱,Graph RAG 有可能为生成的信息提供更细致、准确的上下文。该机构仍在比较 Graph RAG 与标准 RAG的长期计算成本。用于知识管理的生成式人工智能应用是指那些能够帮助监管人员浏览监管机构发布的所有法规和其他指南的应用。这些应用可以帮助监管人员回应受监管实体或高级管理层提出的有关特定法规的查询,开展法规研究,审查受监管实体提交的内容是否符合法规,并更广泛地通知监管决策或行动。此类应用正通过检索增强生成在监管机构的文档上进行训练。此外,本类别还包括那些能够让监管人员使用自然语言(即无需学习编程语言)查询其法规数据库的生成式人工智能应用。总的来说,这些应用正被设计为“副驾驶”或人工智能助手或聊天机器人。正在开发的应用程序相当均匀地分布在三个类别中;而处于实验阶段的那些则明显集中在第二和第三个类别中。 从基础开始:监督领域生成式人工智能应用盘点以下为此类用例的示例:•作为评估金融机构治理有效性的组成部分,监管机构通常会审查董事会会议记录。一家监管机构正在开发一款基于LLM的应用程序,以协助进行此类评估。该应用程序将能够向监管机构提供信息,例如:rag工作流中的安全护栏优化搜索,并有助于确保输出与已验证的来源正确对齐。该应用程序还将能够积累以往董事会会议纪要中的发现,并比较每位董事参与程度随时间的变化。在后期阶段,计划使用该应用程序评估其他文件。然而,目前的挑战是在于确保信息安全,鉴于所评估信息的敏感性。在现场检查期间,监管人员必须审核金融机构提交的大量文件,以提取见解并跟踪问题。为了帮助监管人员在执行此任务,一个机构利用生成式人工智能构建了一个概念验证,该验证将作为智能助手,帮助监管人员更有效地定位和导航文件。特别是,该应用程序旨在:(i)从大量文件中提取相关信息;(ii)比较文件之间的内容;以及(iii)随着时间的推移审查定性信息,以识别趋势和模式。该应用程序还可以用于将金融机构与其同行进行比较,并从过去的检查中发现类似问题。该应用程序将具有几个组件,包括:将扫描文档或图像文件转换为机器可读文本并查找通过嵌入式文档提供每个文档的预览,以便用户可以选择相关文档。o 评估生成一个参考文献列表,其中提取了见解,并解释如何这些见解是相关的。•一家监管机构为金融机构与其客户间的争议提供内部替代性争议解决(ADR)系统的支持。在审理案件时,确保类似案件处理的连贯性和遵守相关法律至关重要。然而,由于案件复杂性和数量繁多以及覆盖主体的多样性,做到这一点具有挑战性。因此,该监管机构决定开发一个由生成式人工智能(gen AI)驱动的聊天机器人,该机器人将在已由ADR裁决的案件中接受培训。该聊天机器人仅供内部使用,并仅对监管机构开放,将允许对先前案件进行语义搜索,根据ADR的过往裁决回答关于特定案件的查询,并起草特定案件的摘要。用于文档审查的生成式人工智能应用程序是指能够通过监督实体的文档(例如监管 submission、年度披露、保险政策、恢复计划)并评估其是否符合法规的应用程序。在某种程度上,文档审查应用程序是知识管理应用程序的延伸。后者提供一个人工智能助手,将帮助识别监督者可在评估监管 submission 时使用的相关法规,而前者则自动化了评估部分。此类中的其他应用程序是指那些能够将监督实体的文档与其他信息来源(例如,相关公开信息是否未在财务报表中提及,或 submission 是否与其他