赛 迪 研 究 院主 办 2025年6月15日总第90期2第期 本期主题 □全球智能体发展进展、面临挑战与对策建议 『所长导读』 智能体是以大模型为核心驱动,具备感知、学习、适应、决策、执行能力的智能系统,是推动人工智能从以大模型为代表的生成式人工智能迈向代理式人工智能的主导产品形态,是人工智能落地应用的战略必争领域。当前,智能体在全球范围内快速兴起,不仅深刻改变了软件产业发展范式,更为实体经济转型提供了新生产力工具。 “本期主题”《全球智能体发展进展、面临挑战与对策建议》系统阐述智能体概念内涵的演进历程,深入分析全球智能体技术研发和应用创新的最新进展,客观梳理全球智能体发展面临的技术、应用、生态等多重挑战,并从推动技术创新、深化融合应用、完善标准体系、加强人才培养等维度提出系统性对策建议。本期内容由王宇霞、胡靖阳、牛子佳、刘健、刘丽超、许旭撰稿,不足之处,请不吝指出。 赛迪研究院信息化与软件产业研究所所长 韩健2025 年 6 月 15 日 目 录目 录CONTENTS 本期主题:全球智能体发展进展、面临挑战与对策建议 一、智能体概念内涵不断演进………………………………………1 (一)智能体泛指具有感知决策能力的代理体……………………………………1(二)当代智能体主要指以大模型为基础的智能系统……………………………3(三)当代智能体是下一代软件演进跃迁的新方向………………………………4 二、全球智能体技术研发和应用创新不断加快……………………6 (一)技术研发持续突破,核心能力不断增强……………………………………7(二)应用创新蓬勃发展,产品形态日益丰富…………………………………10 三、全球智能体发展面临的挑战…………………………………12 (一)底层技术瓶颈:算法、数据、算力三大要素制约发展…………………12(二)实际部署困境:决策质量稳定性与跨场景协作能力不足………………13(三)产业生态挑战:隐私保护、算法偏见、责任归属等多维度风险并存…13 四、对策建议………………………………………………………14 (一)推动技术创新………………………………………………………………14(二)深化融合应用………………………………………………………………14(三)完善标准体系………………………………………………………………14(四)加强人才培养………………………………………………………………15 本期主题: 全球智能体发展进展、面临挑战与对策建议 AIBO 娱乐机器人是此类智能体在消费电子领域的早期应用,展现了智能体在日常生活和休闲互动中的应用前景。三是基于强化学习的智能体阶段,主要关注使智能体通过与环境交互优化决策过程。在这一阶段,智能体能够从高维输入中学习复杂的策略,并取得许多重大成果。例 如,2011 年 IBM 研 发 的 Watson智能体在《危险边缘》问答比赛中战胜人类冠军;2016 年谷歌研发的AlphaGo 战胜围棋世界冠军李世石,这一系列里程碑展示了智能体在复杂环境中不断提升的决策能力。四是具有迁移学习和元学习能力的智能体阶段,主要关注提高智能体在新 任 务 方 面 的 学 习 效 率 与 泛 化 能力,降低对大量训练样本的依赖。2020 年 DeepMind 推出的 AlphaFold2 在蛋白质结构预测领域的重大突破是这一阶段的标志性成果。五是 一、智能体概念内涵不断演进(一)智能体泛指具有感知决策能力的代理体 智 能 体 泛 指 能 够 感 知 环 境、理解信息并作出决策与行动的代理体,它可以是软件、硬件或者一个系统,具备自主性、适应性和交互能力。从历史起源看,智能体的演进经历五个关键阶段。一是符号智能体阶段,主要使用逻辑规则和符号表示对知识进行封装并推动推理进程。20 世纪 80 年代兴起的基于知识的专家系统是典型代表案例,这类系统在医疗诊断、财务分析等领域展现了智能体在特定任务中的实用价值。二是反应式智能体阶段,主 要 关 注 智 能 体 与 环 境 之 间 的 交互,能够快速感知环境并做出反应。这类智能体的设计优先考虑直接的输入、输出映射,而不是复杂的推理和符号操作。1999 年索尼推出的 基于大语言模型的智能体阶段,将大语言模型作为智能体大脑或控制器的核心组件,并借助多模态感知技术和工具使用等多样化策略显著 扩展感知范围和行动空间。2023 年AutoGPT 的出现进一步提升了智能体的自主性和任务执行能力,推动智能体向更通用化的方向演进。 广 义 智 能 体 包 含 多 种 类 型。按照产品形态划分,包括“硬智能体”和“软智能体”两类,其中“硬智能体”指具备物理实体的产品,包括具身智能、自动驾驶等;“软智能体”指数字世界的软件实体,是未来数字生态的神经中枢,也是“硬智能体”的核心驱动。按照智能体作出决策的依据划分,包括确定性和非确定性两类,确定性智能体是基于固定规则和逻辑运行,结果可预测;非确定性智能体是基于数据驱动的,具有灵活的适应性。 按照智能体作出决策的过程划分,包括简单反射、基于模型的反射、基于目标的、基于效用的四类,简单反射智能体不考虑过去经验,直接根据规则作出反应;基于模型的反射智能体根据历史数据和模型规则共同作出决策;基于目标的智能体以最大化未来目标为依据作出决策;基于效用的智能体可以在目标相互冲突或不确定的复杂环境中作出决策。按照智能体所处层次划分,包括操作系统智能体和应用层智能体,其中操作系统智能体具备操作 计算设备底层硬件和上层应用的能力;应用层智能体面向特定应用,具备调用外部软件工具能力。按照功能定位与应用场景划分,包括智能助理、感知交互、仿真、安全、协作等多种类型。按照智能体数量与协作能力划分,包括单智能体系统、多智能体系统以及人类与智能体协作三类,单智能体系统侧重于独立运作与自主决策,适用于执行明确任务并实现单一目标的应用场景;多智能体系统以智能体协同与 信息交互为核心特征,通过集体智能解决单体智能难以应对的复杂问题;人类与智能体协作将人类认知与机器能力有机结合,构建从工具使 用 到 伙 伴 协 作 的 多 层 次 交 互 模式。 (二)当代智能体主要指以大模型为基础的智能系统 当前,智能体是指以大模型为核心驱动,具备感知、学习、适应、决策、执行能力的智能系统。 会思考能写作,但是不具备使用工具能力。三是代理式人工智能,以智能体为代表,能分解任务、自主决策并执行任务。四是物理式人工智能,以具身智能为代表,是智能体与机器人的结合,能够改造物理世界。当前人工智能正在经历一个 当代智能体是人工智能新发展阶段的重要产品形态。英伟达 CEO黄仁勋认为,人工智能发展可以分为四个阶段,一是感知式人工智能,以图像识别等为代表,具备能看能听能力,但不具备思考能力。二是生成式人工智能,以大模型为代表, 新的拐点,正在从生成式迈向代理式阶段,智能体是新发展阶段的重要产品形态。 够解决问题的“项目经理”,能力发生飞跃质变。 (三)当代智能体是下一代软件演进跃迁的新方向 当 代 智 能 体 是 大 模 型 之 上 能力更强的系统。大模型擅长知识处理和语言交互,是一种被动响应输入,智能体则拥有自主思考和调用工具的能力,能实现端到端的问题解决。具体来看,从功能定位方面,大模型以内容生成及理解为核心能力,而智能体以任务完成为目标,具备规划和执行能力。从模型结构方面,大模型为神经网络架构,智能体则是多组件系统,包括感知器、大模型、工具、记忆组件、规划器等。从自主性方面,大模型为被动响应输入,无主动决策能力,智能体可主动规划、迭代、调用工具。从应用场景方面,大模型适用于问答、写作等生成式服务,智能体可解决一站式智能助手等复杂问题或端到端问题。综合看,智能体能力不再仅限于大模型的被动响应人类指令,而是可以理解人类意图、自动分解任务、作出决策并寻找可用工具执行任务,推动人工智能从只会回答问题的“做题家”升级为能 智能体的核心软件属性既延续传统软件的本质特征,又通过智能化实现能力跃迁,代表了下一代软件变革演进的新方向、新形态。 智能体的软件属性不变,其本质是由代码构成的可执行程序的延续升级。智能体通过自主决策系统和动态适应能力,将软件从“工具属性”升级为“伙伴属性”,但其代码驱动、可执行、可管理的软件本质属性未变。从代码驱动的一致性看,智能体的大模型推理、强化学习策略等核心决策模块本质上是动态代码的集合,API、数据库等工具调用仍依赖于软件接口规范;从运行环境的一致性看,智能体需部署在服务器、云端或边缘设备,依赖操作系统、容器化技术,与传统软件的运行环境兼容,如谷歌云平台、亚马逊云服务、微软 Azure 云平台提供各种云计算服务,用于构建和部署智能体;从部署运维的一致性看,智能体遵循需求分析→设 计→编码→测试→部署→运维的软件开发流程,依赖软件开发相关的版本控制、测试、监控等工具提升开发效率、保证质量。 软件”将交由智能体判断,软件特别是工具软件的生态将迎来重构,有可能转变为智能体的功能插件或数据源,从一体化转向原子化、从人类友好转向智能体友好将是工具软件的演进趋势。 智能体推动软件的用户从人变为智能体,从而推动软件向原子化、个性化、智能体友好转变。过去软件面向的用户群体是人,界面的易用性、功能的完备性是争夺用户的核心要素,但正因为功能设置过于繁琐,加上需要人通过点击等操作方式来使用特定功能,造成诸多“隐藏产品”和“隐藏功能”出现。相关数据表明,微软应用商店现有超过 16 万个 APP,“搜索难”“选择难”问题一直存在。根据微软发布会公布的数据,PowerPoint、Excel中超过 90% 的功能因“操作难”而被用户闲置。智能体能够有效解决上述问题,其进行任务规划、调用和使用工具的能力能够帮助用户完成“选软件 - 手动操作软件”的整个过程,用户仅需在聊天界面中用自然语言描述需求,智能体就能自动执行任务。这表明,用户与软件之间将产生隔离,软件的用户将从用户端转移到智能体,“运行哪款 智能体推动软件形态由“静态”变为“动态”,从而改变软件的生产范式。过去软件的开发是通过人总结经验并将其转化为机器能够理解的代码,其运行规则是既定的,任务执行只能依据既有的规则进行机械化响应,每次功能更新都需要对软件进行重新开发。智能体依托大模型的“思考”和“学习”能力,克服了传统软件规则僵化、响应机械、升级困难的局限性。人类向智能体下达任务指令后,智能体能够依据任务要求自适应调用功能、工具甚至自主编写代码来完成指定任务,比如在金融分析中,Manus 可以 自 主 制 定 搜 索 方 案、 抓 取 数 据信 息、 编 写 Python 分 析 脚 本 并 生成可视化图表。另外,智能体凭借自主学习能力还能实现自成长、自演进。例如,借助强化学习算法,Devin 每周的编程能力迭代提升幅 性,如同一个自组织系统持续演化,可以突破单一软件在任务类型和应用场景上的限制。研究数据显示,现有的软件工程智能体中,多智能体系统占比达 52.8%。比如阿里云发布的智能编程助手通义灵码 2.0,通过规划智能体、搜索、生成、单测、调试智能体等多智能体框架来处理复杂的软件开发任务。在智能体互联互通特性的支撑下,用户逐渐无需在多个软件产品或者云端 SaaS 产品之间进行切换,“订阅多个独立软件或 SaaS”可能转变为“订阅一个通用智能体”。这或将推动以往按工具使用收费模式向按任务量收费模式的转变。 度达 15%,目前已精通 12 种主流编程语言,熟练使用 300+ 开发框架。在代码质量评测中,其生成代码的稳定性和可维护性得分比初级程序员平均水平高出 37%。未来,智能体将同时扮演软件本体、软件使用者以及软件设计、编写、修改者等多重角色。软件的生产模式将从人类学习掌握机器语言进而完成软件开发的模式,转变为智能体按照人类需求完成软件功能扩展和迭代的模式。 智能体推动软件由“孤岛”走向“互联”,从而改变软件的商业模式。与传统软件作为独立工具、彼此无法相互调用不同,智能