您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [赛迪]:人工智能体(AI Agent)应用现状挑战及建议 - 发现报告

人工智能体(AI Agent)应用现状挑战及建议

信息技术 2025-03-25 赛迪 丁叮叮叮
报告封面

『所长导读』2024 年中央经济工作会议指出,要“开展新技术新产品新场景大规模应用示范行动。要开展‘人工智能 +’用人工智能展现出引领新一轮科技革命和产业变革的强劲驱动力,人工智能体(AIAgent)作为大模型发展和应用的重要发展方向,在对话交互、知识推理、内容创作等方面潜力强大,有望成为加速“人工智能 +”落地,深度赋能千行百业的重要依托。通过集成感知、推理与行动能力,人工智能体正逐步渗透到金融、制造、医疗、教育等多个领域,推动从信息处理到实际任务执行的智能化转型。抢抓发展机遇,积极推动人工智能体技术创新与产业应用,对于加速“人工智能 +”行动,推动人工智能赋能新型工业化具有重大意义。为把握人工智能体发展趋势,研判发展机遇与挑战,本期专刊系统梳理了人工智能体的技术特征、发展历程、应用场景和产业生态,分析了全球主要经济体和重点企业的布局动向,深入探讨了我国人工智能体发展面临的生态建设、经济效益、场景落地等方面挑战,并从标准制定、生态优化、应用推广、政策支持、技术攻关等维度提出了相关建议。期望本期内容能引起各级政府部门和业界的关注,对上级领导部门以及地方相关机构预研“十五五”人工智能产业发展起到决策支撑作用,为下一步布局发展重点提供重要参考。 行动,培育未来产业”。当前,以大模型为代表的通赛迪智库无线电管理研究所(未来产业研究中心)所长 蒲松涛2025 年 3 月 25 日 人工智能体落地现状挑战及建议一、人工智能体概述、发展趋势和战略意义………………………1(一)人工智能体的定义和特征……………………………………………………1(二)人工智能体的发展历程和未来发展趋势……………………………………5(三)发展人工智能体的战略意义…………………………………………………7二、人工智能体发展动向与应用场景布局…………………………8(一)全球各主要经济体人工智能体发展动向……………………………………8(二)人工智能体典型应用场景分类与实践……………………………………11三、人工智能体的技术栈与产业链………………………………12四、人工智能体厂商动向…………………………………………14(一)国外厂商动向………………………………………………………………14(二)国内厂商动向………………………………………………………………17五、人工智能体发展的挑战………………………………………19(一)人工智能体的开发尚未形成成熟的生态环境……………………………19(二)人工智能体的经济效益暂不明显…………………………………………20(三)人工智能体的应用场景存在较大限制……………………………………20六、启示与建议……………………………………………………21(一)统一人工智能体定义与行业标准,推动产业规范化发展………………21(二)优化人工智能体生态体系,构建多方协同创新平台……………………21目 录目 录CONTENTS 本期主题: (三)依托标准推进典型应用推广,形成行业发展清单………………………21(四)加强政策支持与保障,构建长效发展机制………………………………22(五)加大核心技术攻关,突破人工智能体发展瓶颈…………………………22 一、人工智能体概述、发展趋势和战略意义(一)人工智能体的定义和特征人工智能体(AI Agent)是一种基于人工智能技术理解外部环境刺激并生成有意义的具身动作的交互系统。技术体系方面,人工智能体技术体系涵盖人工智能多个核心领域,主要包括环境感知、决策规划、自主学习、多模态交互以及任务执行等关键技术。人工智能体的应用形式丰富多样,主要产品包括虚拟助手、智能客服、自动驾驶系统、工业机器人以及智能投顾等。通过集成感知、推理与行动能力,人工智能体正加速应用于自动化生产、智能服务、个性化推荐、教育医疗等领域,推动了从信息处理到本期主题:人工智能体落地现状挑战及建议 《未来产业研究》2025年第1期实际任务执行的技术转型。系统结构方面,人工智能体系统内部是对单个或多个大语言模型和各类工具的编排,其编排方式可以是固定,也可以由大语言模型根据任务需求动态调整。固定编排的人工智能体包括提示链式、路由式、并行式等,接收任务后按预定流程执行。动态编排的人工智能体在执行任务时,会根据实际情况向用户或环境获取信息并调整执行方式,这些行为均由其内置的大模型决定和执行。动态编排的人工智能体在复杂问题上表现更佳,但增加延迟和算力消耗;固定编排则更具确定性和一致性。因此,应根据应用场景选择合适的编排方式。 1 交互和沟通能力,人工智能体能通过自然语言处理等技术方法理解来自人类或其他智能体的指令并生成回应。五是知识表示和存储能力,人工智能体可以组织和存储知识,通过不同方式表示并利用这些知识支持决策和行动。六是情景感知和应变能力,人工智能体能感知情境变化,灵活调整决策和行动策略以适应不同需求。针 对 不 同 的 应 用 场 景, 人 工智能体的具体设计会在某些功能上有所突出或保留,但为了实现其基 2《未来产业研究》2025年第1期核心能力方面上,人工智能体通常需要具备六项能力。一是感知和理解能力,人工智能体需要应用传感器、计算机视觉和自然语言处理等技术感知并理解图像、声音和文本等外部信息。二是决策和规划能力,人工智能体需要结合输入的信息和自身存储的知识使用逻辑推理等方法制定决策。三是自主学习和适应能力,人工智能体可以通过增强学习和迁移学习等方法,从过往经验中学习并调整决策制定和行动过程,提高自身适应能力。四是 本的能力和特征,需要包含大语言模型、任务规划模块、工具使用模块和存储模块。大语言模型是人工智能体的核心部件,提供核心的语言理解、推理与生成能力,是人工智能体的“大脑”。任务规划模块借助大语言模型对复杂任务进行分解、规划和调度,并及时观察子任务执行的结果与反馈,对任务及时人工智能体作为一种新兴的技术应用,不同的学者和机构从各自的研究视角出发,对其定义和架构提出了多种见解。这些定义既体现了各自的技术侧重点,也在一定程度上存在共性与差异。为了全面理解人工智能体的概念,需要综合考图 2 人工智能体具备的基本能力特征 3《未来产业研究》2025年第1期调整。工具使用模块在大语言模型的指导下与可调用函数、数据库和硬件设备等外部工具进行交互,扩展智能体的能力,相当于智能体的“手脚”。存储模块为智能体保存以往交互过程中的信息或使用者的个人偏好,扩充智能体在特定领域的知识,优化使用体验。虑不同机构和专家的观点,从模块设计、核心能力、运行模式以及安全与伦理要求等多方面进行探讨。据不完全统计,目前已有十余家机构或和专业人士对人工智能体给出了较为系统的定义,具体内容如下表所示。资料来源:OpenAI 5《未来产业研究》2025年第1期模型技术实现通用人工智能。2017年谷歌提出Transformer模型,随后BERT、大规模GPT模型等技术接连问世,标志着大语言模型时代的到 来。2023年,GPT-4和AutoGPT的发布掀起了基于大语言模型的人工智能体研发热潮。与传统模型不同,这些智能体能够通过自主执行任务和管理复杂流程,在生成式人工智能、项目管理和知识图谱等领域展现出强大的潜力。AutoGPT、MetaGPT、BabyAGI等项目的爆发,使人工智能体不仅具备更强的任务处理能力,还推动了大语言模型从单纯的对话系统向通用问题解决方案的迈进。与此同时,全球厂商竞相开发开放式大语言模型生态,为人工智能体的多元化应用提供了广阔舞台,进一步加速了从大语言模型到通用人工智能体的进化。未 来 人 工 智 能 体 将 向 着 多 模态学习、动态适应和实时决策等技术方向发展,提升其感知、理解和决策能力。多模态学习通过对齐文本、图像、语音等不同数据类型,使人工智能体能够综合处理不同形态的信息,增强其对现实世界的理 (二)人工智能体的发展历程和未来发展趋势人工智能体概念自诞生以来,主要经历了两个发展阶段。第一阶段主要追求在特定任务范围内展现出 一 定 程 度 上的智能。20世纪50年代,阿兰•图灵在提出图灵测试时,首次扩展了“高度智能有机体”的概念至人工实体,奠定人工智能体发展的哲学基础。随后,智能体概念逐渐形成,用于描述能够感知环境、做出决策并采取行动的人工智能系统,成为人工智能领域的基本构建模块。50年代至60年代,人工智能兴起,智能体技术随着编程语言、硬件的发展有所突破,但受到技术限制与两次人工智能寒冬的 影 响 进 展 缓慢。直到1980年代末,智能体研究逐渐聚焦于自主性、反应性、主动性和社交能力等核心属性,为人工智能体的发展建立了理论框架,并推动了一系列重要应用的出现,如1997年IBM的深蓝击败国际象棋世界冠军以及2011年Siri的问世,这些里程碑标志着人工智能体从概念走向初步实践。第二阶段主要追求采用大语言 6《未来产业研究》2025年第1期解,拓宽输入输出带宽,从而推动其在自动驾驶和机器人操作等复杂交互与决策场景中的应用。动态适应技术结合强化学习和增量学习方法,通过实时分析环境变化和人机交互,使人工智能体能够动态调整参数、更新策略或选择最优路径。实时决策技术的发展要求人工智能体在算法上搭载支持实时数据流处理的框架,在系统架构上融入边缘计算和分布式计算的思想,从而在复杂、不确定的场景中实现低延迟、高精度的决策,灵活响应环境变化。人工智能体正逐步拓展更多行业领域,并在不同领域中发展垂直领域的大模型,提供高度定制化的解决方案。当前人工智能体更多应用于第三产业或作为一种“新奇玩具”,未来将向工业制造、建筑、军事、医疗、家庭、康养等多层级、多方面领域延伸,推动行业深度变革。例如,产业大模型在制造、物流、金融、医疗等领域取得突破性进展,显著提升了行业效率和数字化水平。如盘古钢铁大模型在宝钢的热轧生产线上线后,钢板成材率提升0.5%,每年可多生产2万吨钢 板,增收9000多万元。此外,在高炉炉况优化单个场景,预计每年也可为宝钢降本超过10亿元。这些垂直领域模型通过大模型与小模型的衔接、新旧模型的结合,展现了强大的赋能作用。人 工 智 能 体 的 发 展 正 向 构 建多人工智能体协作和即时部署的产品理念迈进,通过协作与分工提升系统效率、适应性和鲁棒性,催生新型应用模式。多人工智能体协作是指多个智能体共同分担任务,通过通信与协调在动态环境和复杂任务中实现更高效的决策与执行,相较于单一智能体,其在应对大规模任务和复杂问题方面展现出显著优势。预计到2035年,基于多智能体的市场将以近50%的年复合增长率增长。此外,人工智能体技术还衍生诸如人工智能体即时部署的新形态应用,该部署方式使企业或个人能够按需租用定制化智能体完成数据标注、内容审核、财务建议等任务,大幅降低成本并提升效率,为产业生态注入更多创新动能。 7《未来产业研究》2025年第1期能在自然语言理解和生成方面的不足,但仍在场景适配性、任务执行能力和可靠性方面存在局限。人工智能体作为理想的应用形式,不仅能扩展大语言模型的任务能力,还能提升其稳定性和实用性。通过人工智能体技术,大语言模型能够快速实现落地应用,在实际运营中降低初期开发和迭代成本,帮助企业以较低的投入快速部署系统,同时通过人工智能体的实际表现,收集真实场景数据以优化模型参数,增强大语言模型在具体场景中的适应性和精准性。人工智能体是产业升级的“催化剂”,发展人工智能体既能推动人工智能赋能新型工业化,又能培育新模式新业态。首先,人工智能体的发展催生了新型产业模式,打造了新的经济增长点。围绕人工智能体产业链,涌现出一批涵盖模型服务、数据存储、工具库与框架设计等领域的新兴企业,推动了智能技术产业链的繁荣。其次,人工智能体可以优化诸如工业制造、物流运输和能源供应等传统产业的业务流程,降低生产成本,提高生产效 (三)发展人工智能体的战略意义发展人工智能体是深化人工智能研究、实现通用人工智能这一技术终极目标的重要路径。人工智能体作为感知、决策、学习和交互能力的综合体,为复杂任务提供了任务驱动的实验平台,助力通用人工智能研究。人工智能体的发展还