AI智能总结
麦肯锡直接 金融中的生成AI:找到更快,更深入的见解 生成的AI技术可以为财务专业人员自动执行耗时的任务,但它们能得到正确的答案吗? 本文是Steve Eklund,Lisa Kaufman,Avani Kaushik,Andrii Kurdiuk,Jan Svoboda和Edward Woodcock的共同努力,代表了麦肯锡运营实践的观点。 商业领袖对生成AI(gen AI)及其提高财务等公司职能的效率和有效性的潜力。2023年5月的一项调查在大型组织的大约75个首席财务官发现,近四分之一(22%)正在积极调查Gene AI在金融领域的用途,另有4%的人正在寻求该技术的试点。 概念证明旨在解决业务的关键痛点。财务分析师们经常超负荷地要求经理们提供信息,而经理们感到沮丧的是,这可能需要几天的时间以获得相对简单的问题的答案。解决该问题有助于产生对gen AI技术的兴趣和热情(图表1)。 对安全,隐私,准确性,版权和社会操纵的担忧削弱了这种热情。在金融领域,数值数据和数学运算的准确性至关重要,人们还担心通用AI系统可能产生不准确或误导性信息的可能性,这种现象被称为“幻觉”。 2.为工作装配合适的工具和功能 有各种各样的AI解决方案,从本地选项到基于云的解决方案,部署的选择应反映用例的数据敏感性和特定要求。利用现有的IT和数字基础设施可以缩短开发时间,还可以确保Geeral AI解决方案以最小的中断集成现有工作流程。 使用生成AI开发财务助手 在调整其首选技术堆栈后,该公司组建了一个高度集成的跨职能团队来推动开发过程。除了数据科学家和IT工程师, 一家欧洲消费品公司最近为金融专业人士和商业用户开发了一种概念验证ge AI助手。这个新工具是由数据科学家、工程师和财务专家组成的团队在大约六周内完成的。它允许用户用日常语言询问有关财务绩效的问题,并迅速获得帮助他们理解和解释数据的答案。 该团队包括财务团队的高级成员,他们在开发和测试阶段帮助塑造设计并充当超级用户。他们的投入对于确保新工具满足组织的质量,可靠性和可用性要求至关重要。 这种概念验证只是该公司在财务职能中应用Gen AI的第一步,但它为寻求在管理风险的同时获取这些技术的好处的组织提供了一些有用的经验教训。 3.把人类放在循环中,让他们在那里 该公司还非常重视用户界面的设计,保持一致的 结构和“外观” 提供简单和简化的用户体验。用户的一个早期要求是能够快速向下钻取财务数据,以获得他们所需的信息。为了促进这一点,该工具提供了即时图形可视化的结果,因此工作人员可以快速吸收和解释其答案。所有数据也以表格格式提供,可与其他分析工具共享。 1.从高影响力、面向内部的用例开始。 Gen AI试点项目应该为组织解决有意义的问题,而不需要创建新的问题。这需要对将输入模型的数据进行高度控制,并且 将安全挑战或数据滥用的可能性降至最低的设计。在这种情况下,公司选择了一个内部数据集和一个已经熟悉它的用户组。 在开发过程中,该公司从其财务职能中招募了一组超级用户作为产品测试人员。鼓励他们申请 附件1 说明性示例 计算。工程团队正在努力解决这一限制。一种方法是建立一个混合模型,使用LLM的方式,建立其优势和其他数据工具来执行数学操作。为了证明其概念,该公司使用Ge AI系统将用户请求转换为数据库查询,然后将计算工作交给专门的数据分析平台(图表2)。分析系统的输出被传递回AI平台,该平台使用该数据来生成多个最终产品,包括结果的文本precis,计算方法的摘要以及用于创建图形可视化的计算机代码。 该工具在现实世界中的情况下,并评估其可靠性和可用性并提供反馈。 日常用户在模型的质量保证和风险管理中也发挥着核心作用。 关于他们可以提出的问题类型以及如何制定它们的指导。此外,为了更容易检查和验证输出,该模型被设计为生成对其产生的每组结果的基础计算的明文解释。 5.优化提示 AI助手背后的团队也非常注意通过设计用于触发gee AI系统的提示来最大限度地减少错误和幻觉的机会。更短,更简单的提示鼓励大型语言模型产生更可预测的结果。它们也更有效,因为一代AI系统的计算工作量与其在每次交互中处理的语言“令牌”数量密切相关。对于财务助理,团队将工作分为三个不同的交互,每个交互分别由geer AI模型处理: 4.发挥gen AI的优势 虽然gen AI是许多任务的强大解决方案,但其他技术可能更适合整体解决方案的某些元素。通过设计移动功能的解决方案, 可以独立于gen AI对其他技术进行处理,组织可以增强他们构建的工具的稳定性和性能。 支撑许多现代AI系统的大型语言模型(LLM)的一个限制是numeracy。这些系统旨在对自然语言进行操作,而不是执行精确的计算,并且被观察到与数学作斗争 将用户的问题转换为数据查询,生成摘要和解释,并创建可视化。 保持质量并大规模管理风险。这些可能包括持续的监控和审计机制,以评估AI系统行为,确保其符合既定的道德准则。由人工智能专家、伦理学家和法律顾问组成的跨职能团队应该评估人工智能模型和应用,以了解潜在的偏见或伦理问题。在其财务助理概念验证成功之后,这家消费品公司现在正在探索适当的治理结构,以支持更广泛的AI工具部署。 该公司开发了与系统交互的有效提示示例以及指导和培训材料,以帮助用户生成自己的内容。这些培训材料是强调人在循环中的重要性的另一个机会,提醒用户他们有责任检查查询语言中的假设以及每次交互结果的背后。 6.构建健壮的测试环境 微调genAI模型是一个高度迭代的过程。快速测试和验证的能力是成功开发的关键。为了实现这一目标,团队构建了一个全面的自动化测试套件,该套件使用高优先级列表进行操作 生成型人工智能已经在改变专业人士在财务职能和其他领域的工作方式。为了在控制风险的同时获得这些令人兴奋的新技术的好处,公司必须投资于其软件开发和数据科学能力。他们需要构建强大的框架来管理数据质量和模型工程、人机交互和道德。然而,正如这些案例所显示的那样,这些技术可以加速并实现对关键业务信息的访问,为人类决策者提供信息,以做出周到和及时的选择。 高级财务分析师提供的查询。此测试在开发过程中每次更新模型后运行,结果用于进一步完善和操作。 7.建立有效的治理系统随着公司从试点项目转向主流采用General AI工具,他们将需要适当的治理框架来 史蒂文·埃克伦德是麦肯锡斯坦福德办公室的合伙人爱德华·伍德考克是高级专家;丽莎·考夫曼是伦敦办事处的专家;Avani Kaushik是南加州办公室的专家;和Andrii Kurdiuk是伦敦办公室的高级数据科学家Jan Svoboda是合伙人.