AI智能总结
2024 年 12 月白皮书 Getty Images 图片 : Contents 前言 3 执行摘要 4 导言 5 1 AI 代理的定义 6 2 AI 代理的演变 8 2.1.关键技术趋势92.2.AI 代理的类型102.3.高级 AI 代理122.4.AI 代理系统132.5.AI 代理的未来 : 迈向多代理系统14 3展望未来 17 3.1.18关键优势 3.2.18风险和挑战的例子 3.3.20应对风险和挑战 结论 22 贡献者 23 尾注 26 免责声明本文档由 世界经论坛作为项目、见解领域或互动的一部分。本报告中的发现、解释和结论是经世界经论坛促进和认可的合作过程的结果,但其结果并不一定代表世界经论坛的观点,也不代表其全体成员、合作伙伴或其他利益相关者的整体观点。 2024 年世界经济论坛所有权利版权所有。本出版物的任何部分不得以任何形式或任何方式复制或传输,包括复印和录制,或通过任何信息存储和检索系统。 前言 费尔南多 · 阿尔瓦雷斯凯捷首席战略和发展官 Jeremy Jurgens世界经济论坛总裁 在当今世界,科技正在迅速重塑我们生活的方方面面,AI代理作为变革性的工具正重新定义人类互动和社会运作方式。这些代理最初只是简单的计算机程序,现已演进为具备自主决策能力的复杂系统。这一演变标志着一个重大转变,使AI代理成为医疗、教育、金融服务等领域关键行业的重要参与者。 关注和主动管理至关重要。确保人工智能发展符合社会价值观和期待对于其成功融入日常生活至关重要。这些创新的目标是在经济中放大人类的创造力——而非取代它。 这全面的概述为那些参与塑造人工智能技术未来的人士提供了重要的资源。通过探索人工智能代理的能力及其影响,利益相关方可以更好地理解如何利用这些系统的强大功能,在各个领域推动有意义的进步。正是通过这种理解,我们才能确保人工智能技术得到负责任的发展,并以促进人类福祉的方式加以应用。通过谨慎的管理,人工智能代理可以成为促进创新和提高全球生活质量的宝贵伙伴。 人工智能代理的进步带来了众多令人兴奋的可能性和变革潜力。它们能够通过最少的人工干预来管理复杂任务,从而promise了显著提高效率和生产力的前景。 然而,步入这一由人工智能驱动的时代,不仅需要充分利用这些技术带来的巨大益处,还必须应对它们所带来的挑战。诸如伦理问题等议题需要谨慎处理。 在合作中,世界经济论坛与Capgemini通过AI治理联盟携手与人工智能社区共同推进这一关键议题。 执行摘要 这篇论文考察了大型语言模型和多模态模型快速发展背景下AI代理的发展与功能,并探讨其使用所带来的影响。 定义为能够感知并作用于环境以实现目标的自主系统,人工智能(AI)代理正在各行各业中扮演多种角色。这要求对治理框架进行适应以确保负责任的应用。 sectors 如医疗保健、客户服务和教育等领域。然而,AI代理也带来了新的风险,包括潜在的不一致问题。2以及对透明度和问责制的道德担忧。 未来该领域的进一步发展很可能涉及多智能体系统(MAS),其中AI代理协作以应对诸如城市交通管理等复杂挑战。更先进的系统提出了新的互联互通和通信标准需求,以便有效运行,而这些协议仍然需要更广泛的社区进行讨论和达成一致。 AI代理,包含如传感器和执行器等组件,已从基于规则的系统进化为能够进行复杂决策和独立操作的高级模型。得益于深度学习、强化学习和变换器架构的重大突破,1 AI代理的应用范围从工作流程自动化扩展到个人助手。这一进展现在涵盖了更为复杂的基于实用性的AI代理,这些代理集成了记忆、规划和工具集成功能,从而扩展了它们的功能和相关性。 本文强调了在社会中安全引入AI代理所需的坚实治理、伦理指导原则以及跨行业共识的重要性。随着更加先进的AI代理持续扩散,确保其变革潜力与基本的安全性、安全性及治理考量保持平衡变得至关重要。 AI 代理的好处包括提高生产力、专业支持和提高效率 Introduction AI代理变得更为先进,对决策制定、责任归属和监督审查产生了重大影响。 随着人工智能代理的不断进步,社会正逐渐向具备更高自主性的创新系统发展,这些系统能够在minimal 人类干预或指导下完成任务。这预示着由人工智能驱动的新时代,有望影响全球经济的每一个领域。鉴于这一深远的前景,考虑安全和治理措施以引导先进人工智能代理的责任开发与实施变得至关重要。4 随着人工智能(AI)继续发展并融入经济和社会的各个领域,了解AI代理的角色、能力及其可能的影响对于商业领袖、政策制定者及其他参与塑造AI发展、实施和治理未来的利益相关者来说至关重要。 自任务自动化开始以来,代理的概念——一个通过传感器感知环境并利用效应器对其采取行动的实体——一直在不断发展演化。3随着大型语言模型(LLM——处理自然语言的人工智能模型)和大型多模态模型(LMM——处理自然语言、图像、视频和/或音频的人工智能模型)的近期进步,人工智能代理的概念正进入快速发展的新阶段,并伴随着大量创新应用案例的出现。这一阶段正见证从编码助手到工作流程自动化、个人助理等众多领域的新型应用场景的涌现。 这篇论文首先定义了AI代理的概念,随后概述了不同类型的代理及其随时间的发展演变。最后一部分展望未来,并总结了部署AI代理所带来新兴技术和社会经济影响的例子,以及可能的风险缓解措施。 1AI 代理的定义 一个AI代理自主响应输入及其对环境的阅读,以做出复杂决策并改变环境。 根据国际标准化组织的定义 ,5 AI 代理可以被广泛地定义为感觉 (声音、文本、图像、压力等) 的实体。感知器使用并响应(使用) 传感器效应器到其。 AI 代理通常具有环境自治 (定义为操作能力 独立地做出决策而无需 constantly human intervention) 和 权限 (定义为在特定边界内执行特定操作的授予的权限和访问权利) 以实现一组指定目标,从而修改其环境。 信息、做出决策并规划行动。基于AI代理的能力,控制中心涉及复杂的算法和模型,使得代理能够评估不同选项并选择最佳行动路径。 图 1 突出显示了代理是如何由几个核心组件组成的 , 包括 : –外部 (例如 , 人类、另一个用户输入:代理接收的AI代理所接收的输入。这可以是通过聊天界面输入指令、语音命令或预先记录的数据。 –AI 代理输入的数据 感知:关于环境的接收,这些信息可能来自各种传感器或其他数据源。它们代表了代理对环境的感知或理解。 –AI 的界限 环境:代理操作的区域。它是指代理应用其传感器和执行器以根据控制中心接收到的输入和决定的动作感知并修改其周围环境的区域。环境可以是如 物理基础设施映射了自动驾驶车辆的区域 , 或者例如编码代理的数字基础设施业务。 –代理人用来使用的工具 效应器:作用于其环境的动作。在物理环境中,效应器可能包括机器人手臂或轮子,而在数字环境中,它们可能是发送给其他软件系统的命令,例如生成数据可视化或执行工作流。 –代表所做的更改动作:执行器。在物理环境中,动作可能是指推 –机制 , 通过这些机制传感器:代理感知其环境。传感器可以包括物理设备(例如摄像头或麦克风)以及数字设备(例如对数据库或网络服务的查询)。 动一个物体,而在数字环境中,它们可能与更新数据库相关联。 –通常构成核心控制中心 : AI 代理与模型一起使用 , 例如 L LM 。控制中心有助于处理 AI 代理的演变 开发者们已将AI从基于规则的系统转变为能够在执行任务时学习和适应的主动代理。 更为广泛地应用。AI系统开始从数据中学习、随着时间适应并提高性能。这一时期引入的神经网络为深度学习奠定了基础,而深度学习自此成为了现代AI不可或缺的部分。 人工智能的发展始于 20 世纪 50 年代 ,6并且此后,它们从简单的基于规则的系统发展成为能够进行复杂决策的高级自主实体。早期的人工智能以确定性行为为特征,依赖于固定规则和逻辑,这使得这些系统具有可预测性,但无法从新经验中学习或适应。 自2017年以来,大语言模型(LLMs)的发展已经transformed了人工智能在自然语言理解和生成方面的能力。这些模型通过使用大量数据来生成类似人类的文字,并从事复杂的语言任务。 人工智能研究的进步引入了能够处理更大数据集并管理不确定性系统的工具,导致概率结果和非确定性行为。这一转变使得决策更加灵活和动态,超越了僵化的框架。 今天的AI代理使用各种学习技术,包括强化学习或迁移学习,这使它们能够不断 refining 自身的能力、适应新的环境并作出更为明智的决策。 20 世纪 90 年代标志着一个重要的转折点 , 机器学习应用程序成为 2.1 主要技术趋势 在过去25年中,计算能力的增长、互联网上大量数据的可用性以及新型算法突破,已使得基础技术取得了显著进展,这些技术支撑了近期人工智能代理能力的提升。以下简要概述了这些发展。 促进学习 1. 监督学习 : 标记的数据集 , 因此模型可以准确地预测或分类新的 , 以前看不见的数据。8 启用代理强化学习:通过在动态环境中不断尝试和错误 来学习最优行为。代理可以持续更新知识库而无需定期重新训练。9 大型模型 3. 与人的强化学习使代理适应和反馈:通过人类反馈进行改进,特别是专注于使AI行为与人类价值观和偏好保持一致。10 大型语言模型(LLM)和大型多模态模型(LMM)已革命性地提升了人工智能代理的能力,特别是在自然语言处理以及生成文本、图像、音频和视频方面。 涉及采取预先训练的4. 转移学习:模型通常在大型数据集上训练(例如,识别汽车),然后将其适应新的但相关的问题(例如,识别卡车)。11 大型模型的出现得益于多项技术进步以及变压器架构的发展,后者为对上下文和词间关系的深入理解铺平了道路,显著提高了自然语言处理任务的效率和性能。7总之 , 先进的 AI 模型能够更好地理解、生成和参与自然语言。 涉及采用预训练模型 5. 调整:对较小的任务特定数据集进行进一步训练。这一过程使模型能够在保留其基础知识的同时,提高在专门任务上的性能。12 这些和其他学习范式通常会被结合起来使用,并且极大地扩展了AI代理在各个应用领域的问题解决能力。AI代理的发展过程详见图2,而代理类型将在下一节中进一步扩展。 机器学习和深度学习技术 一系列技术极大地提升了AI模型的效率和专业化程度,从而改进了人工智能模型。机器学习和深度学习技术的一些示例包括: 2.3 高级 AI 代理 许多当前的AI代理的架构往往基于或与LLMs相关联,且这些LLMs以复杂的方式进行配置。图3呈现了一个简化的示例。 概述导致 AI 代理当前突破的关键组件及其不断增长的功能范围。 是一种技术,其中AI代理有系统地处理并阐述中间步骤以达到结论,这增强了代理以透明方式解决复杂问题的能力,因为模型底层推理的每一步都被再现为自然语言。19 AI 代理以, 这是用户输入指向代理的控制中心。用户输入可以 是执行指令的提示。directs the控制中心用户输入到模型中,该模型构成了AI代理的核心算法基础。此模型可以根据应用需求是大型语言模型(LLM)或中型语言模型(LMM)。随后,该模型处理用户指令的数据输入以生成所需的结果。17 对于连续性和 内存管理对于操作的相关性。该组件确保AI代理能够记住之前的交互并保持上下文。这对于需要历史数据来辅助决策的任务或在聊天机器人中维持对话上下文至关重要。 在架构的核心是控制中心,这是一个至关重要的组件,负责管理系统中信息和指令的流动。它充当编排层的角色,将输入引导至模型,并将输出路由至适当的工具或执行器。简单来说,这一层协调信息流,涉及以下五个方面:1)用户输入、2)决策与规划、3)内存管理、4)工具访问以及5)系统的执行器,从而在数字或物理环境中实施行动。18 使 AI 代理能够访问和交互 具有多种功能或模式的工具。例如,在线环境