您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[第一新声智库]:2025年中国企业级AI Agent应用实践研究报告 - 发现报告

2025年中国企业级AI Agent应用实践研究报告

2025-09-23-第一新声智库L***
AI智能总结
查看更多
2025年中国企业级AI Agent应用实践研究报告

目录 CONTENTS 01 企业级Agent市场分析 定义与背景 2025年企业级Agent应用市场规模约为232亿元全球企业级AI Agent优秀厂商图谱企业级Agent采购分化:头部企业成采购主力,中小企业踌躇成本门坎传统软件AI升级&AI原生软件:从“提升旧世界效率”到“定义新世界规则”垂直AI Agent重构SaaS行业:从效率提升到价值创造的范式革命全球Agent商业化模式分析:B端生态分化,C端模式趋同 AI大模型的定义与分类AI Agent的定义与分类AI Agent的发展历程Agent = 大模型+规划能力+记忆能力+行动能力AI Agent三级跃迁,产品形态与技术能力的协同演进MCP增强Agent与工具间的互联互通能力不是所有AI模型/产品都是Agent,关键在于"工具调用能力"AI领域投融资分析:美国重视底层技术,中国聚焦头部大模型AI政策背景:中国将深化“人工智能+”行动:政策支持力度空前 04 优秀厂商及案例分析 通用AI Agent:阿里云、腾讯云、智谱、北电数智垂直AI Agent:美洽、玄武云、神州云动、蓝凌 02 AI Agent应用现状 05 2025年AI大模型应用市场规模约为328亿元全球AI巨头价值链布局全景图:谁家更全面?谁家有短板?GPT-5提升全球标准,国产大模型快速追赶,缩小技术代差中美Agent性能差距显著缩小:国际泛化能力占优,国产垂直场景深耕中国企业级AI Agent正处于从“普及级”向“融合级”过渡的阶段AI Agent应用场景智能客服渗透率最高,数据分析成为第二增长曲线AI Agent应用的痛点与挑战 趋势与展望 AI新型生产力:从“AI辅助人类(Copilot)”到“AI自主服务(Autopilot)"央国企+AI:超60%央企构建"大模型+Agent"双引擎Agent+机器人:为具身智能赋予“大脑”的关键价值Agent三大产品趋势:编码智能体、CUA与多模态交互智能体的崛起通用Agent流量入口:颠覆传统搜索引擎,开启新的流量大战 定义与背景 定义与背景 AI大模型的定义与分类 AI大模型(Large AI Models / Large-scale AI Models) 是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系。从应用领域角度分类,AI大模型分为通用大模型、垂直大模型;按输入数据类型,AI大模型分为单模态大模型、多模态大模型;按开放性分类,AI大模型分为开源大模型、闭源大模型。 也称“基座模型”。在超大规模、广泛领域的数据上预训练而成,拥有强大的知识表示、语言理解与生成、基础推理能力。在多个领域和任务上通用。 在通用大模型的基础上,使用特定领域的专业数据和知识进行精调或继续预训练,使其在特定领域,如医疗、金融、法律、编程、生物医药等的表现显著优于通用模型。 主要处理和生成单一类型的数据,包括纯文本、纯图像、纯语音等。常见的单模态大模型包括百度的文心一言、阿里的通义千问等。 能同时理解和生成多种类型的数据,包括文本、图像、视频、语音等,实现跨模态的信息融合、推理和创作。典型的多模态大模型包括腾讯的hunyuan-vision、商汤科技的日日新等。 模型权重、部分训练代码及数据公开,允许研究、修改和私有化部署。透明度高,可定制性强,有助于促进社区创新,降低依赖风险。典型的开源大模型如深度求索的DeepSeek、百川的Baichuan等。 模型权重和训练细节不公开,通过API、云服务或特定产品提供能力。通常由大型科技公司开发维护。性能通常领先,服务稳定,易于集成。典型的闭源大模型如百度的文心一言、阿里的通义千问等。 定义与背景 AI Agent的定义与分类 AI Agent(智能体)是一种具备环境感知、自主决策与行动执行能力的人工智能系统。其核心能力架构包含四个关键维度:感知能力(Perception)-解析、理解环境信息与用户输入、进行知识推理、生成文本;规划能力(Planning)-制定目标导向的任务策略;行动能力(Action/Tool Use)-调用工具或API执行操作;记忆能力(Memory)- 存储并关联历史交互与知识。AI发展可划分为五个阶段:L1聊天机器人、L2推理者,L3智能体、L4创新者、L5组织者,智能体处在第三阶段。 02有条件自动化 01部分自动化 感知能力:多模态规划能力:大量流程节点行动能力:工具数量、类型极大提高记忆能力:结构化数据存储 感知能力:单一模态规划能力:涉及少量流程节点行动能力:少量标准工具调用记忆能力:任务结束后重置 L3 智能体 04完全自动化 03高度自动化 L2 推理者 感知能力:少量人工干预下高精度感知力规划能力:业务流程灵活适应和编排行动能力:少量人工干预下绝大多数工具调用记忆能力:长期记忆检索 感知能力:自主进化超高精度感知力规划能力:自主提升规划和编排能力行动能力:自动化调用工具记忆能力:自主构建知识图谱 L1 聊天机器人 定义与背景 AI Agent的发展历程:从传统架构到现代范式 AI Agent的发展可分为两大阶段。2017年之前可视为传统架构时期,从麦卡锡的“建议接受者”设想,到包容架构、BDI架构、混合架构,该阶段的研究为Agent奠定了初步的理论与架构基础。2017年之后,随着Transformer架构的提出,AIAgent进入现代范式阶段。大语言模型如GPT-3扮演了“大脑”角色,突破了传统系统的能力限制。工具调用与外部API集成使Agent获得“手脚”,实现与现实世界的高效交互。多模态模型和标准化工具协议进一步扩展了其感知与执行能力。 •1959年:Agent的概念源于约翰·麦卡锡提出的“建议接受者”(advice taker),其核心是具备感知、推理与行动能力的常识性程序•1970年:比尔·盖茨在《Personal Computer as Agent》一文中设想未来电脑将成为每个人的数字代理人,可视为Agent的词源•1972年:斯坦福大学开发出MYCIN系统,它能够诊断血液感染疾病,标志着第一批“专家级“Agent诞生•1980年:美国麻省理工学院的Minsky提出多Agent系统(Multi-Agent System, MAS),让多个相对简单的Agent协作,共同解决复杂问题•1986年:罗德尼·布鲁克斯提出包容架构,该架构最初被应用于机器人自动化领域的架构设计,这种机制允许多个目标并行处理,由抑制机制来协调最终采取的行动,确保Agent能表现出基础但合理的行为•1987年:布拉特曼提出审议式BDI架构。BDI代表信念(Belief)、愿望(Desire)和意图(Intention)。这一架构的提出使Agent变得更像人类,给Agent装上“心智”•1992年:Innes Ferguson提出Touring Machine混合架构。由三个并行运作、独立驱动的控制层构成,为动态环境中的自主移动Agent提供所需的多样化行为能力。 •2017年:Google提出了基于自注意力机制的Transformer架构,成为现代大模型的核心基石,也催生了现代LLM-based Agent的诞生•2020年:OpenAI推出了GPT-3模型,参数规模达到了1750亿,在零样本学习任务上实现了巨大性能的提升,提供了Agent的“大脑”。它证明了一个统一的模型可以理解、推理并回应各种复杂的指令,奠定了Agent作为“通用任务处理器”的可能性•2021年:OpenAI和Meta分别推出WebGPT和Toolformer, 使大模型学会使用搜索引擎浏览网页并引用来源来回答问题以及自主决定何时与如何调用外部API,赋予了Agent“手脚”。这两个项目从理念上突破了LLM仅是“文本生成器”的局限,证明了工具调用(Tool Use)是扩展模型能力边界的关键范式,是Agent与外部世界交互的核心技术基础•2023年:Open AI发布AutoGPT,能够自主完成复杂项目任务,向全世界展示了Agent的潜力,引爆了“AI Agent”概念,使其破圈•2024年:GPT-4 Turbo with Vision, Claude 3 Opus, Gemini 1.5等模型强化多模态理解和生成能力,使Agent能处理更复杂的真实世界信息•2024年:Anthropic推出MCP(Model Context Protocol)协议,使Agent能够安全、标准化地访问各种外部工具和数据源•2025年:Agent元年,AI Agent产品爆发,深度渗透至各行各业,开启Agent应用的全新阶段 早期定义与传统架构 定义与背景 Agent = 大模型+规划能力+记忆能力+行动能力 AI Agent是“数字人”,大模型是“数字人的大脑”。大模型是AI Agent的核心驱动力与智能基础,它为Agent提供了关键的感知与认知能力,包括理解信息、进行知识推理、生成文本以及展现创造性思维,如同赋予Agent一个强大的“大脑”。AI Agent是在大模型的基础上整合了三大关键能力组件构成的更高级架构:规划(Planning)、记忆(Memory)和工具使用(Tool Use)。这种结合了大模型智能与行动能力的架构,代表了当前大模型应用的最高阶形态,实现了从被动响应到主动规划和执行的跃迁。 大模型感知能力提供者 (AI大脑) Agent行动执行者(AI代理者) 1 行动能力:大模型的工具调用受限于训练数据与模型参数 行动能力:Agent能够突破模型限制,通过不同工具扩展能力 2 记忆能力:大模型局限于单次对话的上下文窗口,虽然可以通过外部存储扩展记忆能力,但本身并不具备管理长期记忆的机制 记忆能力:Agent不仅具有短期记忆,还具备长期记忆。此外,Agent还具有记忆流,能够记录其观察、思考和行动序列,形成可追溯的决策链 3 规划能力:大模型虽然能够通过思维链(Chain-of-Thought)等技术展现出一定的推理能力,但这种能力是静态的、一次性的,无法根据执行结果动态调整 规划能力:Agent具有动态规划能力。能够将复杂任务分解为子任务,制定执行计划并监控执行进度,根据执行结果调整后续计划,并通过反思和自我批评不断改进 Agent是大模型应用的最高形态,赋予AI高度自主性,使其能够独立分解任务、规划步骤并调用工具完成目标。Agent模式下,AI不仅是“助手”,更是具备闭环执行能力的“智能代理” 定义与背景 通往AGI的道路:AI Agent三级跃迁,产品形态与技术能力的协同演进 Agent是AI迈向AGI(通用人工智能)的关键环节之一。其发展可分为三个阶段,既体现产品形态的演进,也标志着技术能力的跃升:初级阶段的智能体侧重于人机深度交互,核心能力构建于大语言模型、提示词工程和向量数据库等技术之上,实现L1部分自动化;中级阶段发展为任务驱动型智能体,需突破多智能体协作框架、复杂任务规划与记忆管理等技术,能够在少量人工干预下完成多步骤复杂任务,达到L2有条件自动化至L3高度自动化;高级阶段将实现纯粹的AGI智能体,无需任何人工干预,达成L4完全自动化。 定义与背景 MCP普及突破传统Agent存在的问题,增强Agent与工具间的互联互通能力 模型上下文协议(Model Context Protocol,MCP),是由Anthropic推出的开源协议,旨在实现大语言模型/Agent与外部数据源和工具的集成。与传统的工具调用方式(如Function Calling、A2A等)相比,MCP具备通用性强、互操作性高、使用门槛低等突出优势,通过提供开放统一的通信标准,有效解决了Agent与外部环境交互过程中存在的生态碎片化和集成成本高昂等问