行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

智能体体检报告

信息技术 2025-07-15 21世纪经济报道发现报告

智能体发展现状：2025年是“智能体元年”，智能体概念火热，垂直智能体领跑市场，编程场景产品已诞生ARR破5亿美元产品。智能体正在接管日常入口，从AI手机到AI浏览器，地图扩张中。容错性与自主性为智能体划分价值象限，垂直智能体凭借深度领域知识和定制化能力，或许更容易找到精准用户并形成可持续的商业模式。
安全合规认知度：业内普遍认同智能体安全合规很重要，但优先级排不进TOP 3。67.4%的受访者认为智能体安全合规问题“非常重要”，但面对技术发展问题，优先级不算高。幻觉和数据泄露是业内最关心的智能体风险，AI幻觉和错误决策（72.1%）、数据泄露（72.1%）、有害内容输出（53.5%）是行业最普遍关心的三个安全合规问题。
安全合规问题：智能体风险被分类为内在和外在安全威胁，内在安全源于智能体核心组件的漏洞，外在安全源于智能体与外部协议、工具、环境的交互。
- 内在安全：大模型的固有漏洞，如AI幻觉问题，差之毫厘谬以千里，在医疗、金融等高风险领域，AI幻觉可能带来严重后果。
- 外在安全：智能体的互动风险，如无障碍权限引发争议，提示词注入的隐蔽风险，MCP协议缺乏集中式的安全监管，智能体协作安全风险高。
合规问题：数据流向与责任分配，近八成的业内人士担心用户数据泄露的后果。智能体协同工作涉及多个环节，每一个环节都可能触发用户数据的收集、存储、调用、跨主体交换。责任划分的基本框架已经成形，但大部分开发者在安全合规方面能力薄弱，缺乏制度性规范和实践经验。

2访问21财经App智库频道获取更多报告 http://m.21jingji.com/thindtank前言2025 年，被称为“智能体元年”。这是 AI 发展路径上的一次范式突变：从“我说 AI 答”到“我说 AI 做”，从对话生成跃迁到自动执行，智能体正成为最重要的商业化锚点和下一代人机交互范式。但越接近落地，风险也越有实感。智能体的核心能力——自主性、行动力，也恰恰是风险滋生的窗口。越能干的智能体，越可能越权、越界，甚至失控。结合调查问卷和行业访谈，本次《智能体体检报告》从最新发展状况、合规认知度、合规实际案例三个角度，试图回答清楚一个关键问题：智能体狂奔之时，安全合规是否就绪了？观点速览1. 概念正热。垂直智能体领跑，编程场景已诞生 ARR 破 5 亿美元产品。2. 地图扩张中。从 AI 手机到 AI 浏览器，智能体正在接管日常入口。3. 谁更“能自理”谁能走得远。容错性与自主性，可以为智能体划分价值象限。4.“安全重要，但不着急”。业内普遍认同智能体安全合规很重要，但优先级排不进 TOP 3。5. 出错与泄露。业内最关心的智能体风险仍是 AI 幻觉和用户数据泄露。6. 下一代应用商店？智能体广场的安全监测、安全标识还不完善。7. 智能体进化之路。智能体协作是落地关键，安全风险问题待解。8. 多工具调用暗角丛生。用户数据流向和责任分配问题待解。 << 01什么是智能体？ 4访问21财经App智库频道获取更多报告 http://m.21jingji.com/thindtank作为市场最火热的概念，今年资本市场及公司动态几乎都与智能体挂钩。但不少讨论中的智能体定义混乱，以至于一千个人眼中有一千个智能体。为了准确把握市场动态，必须清晰界定真正的 AI 智能体，并与前代技术区分开来。OpenAI 将 AI 发展阶段分为 L1 到 L5 五个阶段。L3 阶段即为智能体 (Agent)，能够自主规划和执行复杂任务，同时具备了对话能力、推理能力、长记忆、工具调用这四项能力1。其中，工具调用是最核心的区分要素，只有对话能力的是 L1 阶段的聊天机器人（Chatbot），只有对话和推理能力的是 L2 阶段的推理者（Reasoner）。这种定义有助于我们识别并警惕一些夸大产品能力，将自动化软件或对话式助手包装成智能体。智能体强大能力的自主性、规划能力以及与外部世界交互的能力，也带来了一个核心的矛盾：效用与风险共生。不过，在深入探讨安全风险之前，我们需要先了解智能体最新的技术和产业情况。（一）通用 vs 垂直：编程产品领跑我们将智能体划分为通用型智能体和垂直型智能体，这两者在技术栈、优化目标和应用范围上存在显著差异。通用智能体能够跨多个领域，提供基本认知能力，泛化能力强，能实现多模态交互和生态协同。比如助推了智能体概念的 Manus，其定位是“首个通用智能体”，核心能力在于任务拆解与工具调用，通过提示完成复杂的分析项目。垂直智能体专注于特定领域，深度融合专业知识和行业数据，通过定制优化使行业数据更精准，训练效果更稳定。2024 年以来，垂直智能体在办公软件（WPS、钉钉、飞书）、金融（支付宝、微信风控）、1[ 东吴证券 .AI Agent 深度（二）：2025 Agent 元年，AI 从 L2 向 L3 发展 .(2025.05.04)] 法律（通义法睿、金山晓法）等领域开始落地。总的来说，通用智能体在挑战“上限”和“广度”，而垂直智能体则夯实“下限”和“深度”。通用和垂直方向各有价值。目前来看，垂直型智能体凭借其深度领域知识和定制化能力，或许更容易找到精准用户并形成可持续的商业模式。比如，从数据隐私与合规性角度看，在金融、法律等高度敏感和受监管的行业，市场更倾向于选择了解并能满足特定数据安全和合规要求的垂直解决方案提供商。红杉在 AI 峰会上提到，“企业级市场中，真正先跑出来的入口是垂直领域智能体，因为它们能听懂行业语言，理解真实需求。2能体最先落地的行业和场景可能是知识工作，尤其是代码编程。根据Anthropic 在 2025 年 3 月发布的论文，Claude AI 的使用主要集中在软件开发和写作任务，这两者合计占了近一半的总使用量3用了大约 12 个月的时间，成为最短时间内突破 1 亿美元年经常性收入（ARR）的软件产品，截至 2025 年 6 月已突破 5 亿美元。（二）产业链：复杂的“竞合”关系智能体市场从技术架构角度可以划分为基础层、平台层和应用层，由此搭建起智能体产业链的上中下游。科技大厂巨头、创业团队、终端厂商等市场上的玩家们，在产业链各环节互相交叉渗透。科技巨头的打法普遍以大模型为底座，一边持续迭代，一边布局智能体平台和生态，吸引开发者到平台上搭建各类智能体应用，并将智能2[ 科技新知 . 大厂纷纷入局，百度、阿里、字节抢夺 Agent 话语权 [EB/OL].（2025-05-22）. https://www.21jingji.com/article/20250522/herald/afb3caeac7ea7016f9ee9b0e7e4bd9e1.html]3[ Anthropic. (2025, March). Anthropic Economic Index: Insights from Claude 3.7Sonnet, https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-sonnet-3-7] 5”而智。Cursor 仅 6访问21财经App智库频道获取更多报告 http://m.21jingji.com/thindtank体集成到现有的产品和业务中。凭借在资金、数据、算力、庞大的生态系统和云基础设施，构建全面的“智能体工厂”。毕竟谁拥有了最强大的开发平台和最活跃的开发者生态，谁就掌握了 AI 时代的“入口”与“分发权”。头部创业团队在核心智能体能力（如推理、执行动作）方面做颠覆性创新，形成与科技巨头之间“竞合”的动态关系——它们既接受巨头的投资，又与其展开竞争。比如智谱其股东阵容多元，美团、腾讯、阿里、蚂蚁都位列持股名单，Manus 在今年 3 月份宣布与阿里通义千问团队达成战略合作。终端厂商依靠设备入口、强大的供应链、生态链，在速度和个性化上进行差异化竞争。比如小米通过搭载自研或第三方 AI 芯片，在其众多设备端执行大部分 AI 任务，当遇到复杂任务时，通过金山云等云端服务调用更强算力。上游：底座大模型与基础设施基础模型是智能体的“大脑”，科技巨头们都推出了自己的大模型，如百度文心、阿里通义千问、腾讯混元、字节豆包等。目前，大模型厂商都在加快推进多模态大模型进展，以快速提升通用基础大模型的理解、推理、规划和学习能力，多模态大模型的技术进步让智能体的能力也随之提升。有机构研报测算，强大的多模态基础模型（能理解视觉信息如屏幕内容）和成熟的强化学习训练方法（能训练 Agent 与环境交互），目前已经发展到相对成熟的阶段4。基础设施为模型训练和推理提供必要的计算资源，比如阿里云、华为云、金山云等云计算平台；寒武纪等芯片企业；以及数据采集与标注企业等。随着智能体向端侧发展，对独立、低延时、安全等要求增强，华为、小米等终端厂商都在边缘计算领域大量投入。4[ 东吴证券 .AI Agent 深度（二）：2025 Agent 元年，AI 从 L2 向 L3 发展 .(2025.05.04)] 中游：开发工具与平台框架、工具、平台是连接基础模型和应用场景的桥梁，能够帮助开发者高效构建和部署智能体，提供从模型调用、任务规划到工具集成的全流程支持，比如百度的“文心千帆”、字节跳动的“Coze”、华为的“鸿蒙智能体框架”等。为了进一步降低开发门槛，厂商还推出了可视化的智能体开发工具，让用户能够通过简单的拖拽操作创建自己的智能体。协议上，尤其是 MCP 协议的普及在推动智能体行业互联互通。在MCP 出现之前，智能体想利用外部工具或数据源会面临着巨大困难，比如接口各异、定制开发成本高、生态割裂等。MCP 通过提供一个开放、统一的通信标准，降低了集成门槛，增强不同模型和工具间的互操作性，最终赋能更强大的智能体应用。下游：应用与场景除了上文提到的，智能体广泛应用于各垂直领域，硬件也是智能体应用的一个重要载体，控制硬件（手机、PC、智能眼镜、智能音箱等）是通往个人 AI 时代的新战略高地。几乎所有手机厂商都在为 AI 智能体秣马厉兵：2024 年 9 月，荣耀率先宣布用大模型“全面升级”手机助手，随后小米、华为、vivo、OPPO 等厂商都升级了自家的手机助手，摇身变成 AI 智能体。此外，小米智能体小爱同学还覆盖了平板、电视、音箱、汽车等核心品类设备，华为亦把小艺智能体部署在华为终端的硬件生态和操作系统里。不同于早期的语音助手，智能体的目标是深入终端操作流程，成为全能管家。比如开发者们宣称，只需要一句话，用户无需逐个打开App，手机智能体就能像真人一样在多个 App 之间操作，完成订票、点餐、取消续费等复杂任务。虽然成功率低、响应不稳定、耗时长，仍是目前手机智能体普遍 7 8访问21财经App智库频道获取更多报告 http://m.21jingji.com/thindtank存在的问题，但 2025-2026 年 AI 手机预计会保持高速渗透的趋势。Canalys 预计，2025 年 AI 手机渗透率将达到 34%，端侧模型的精简以及芯片算力的升级将进一步助推 AI 手机向中端价位段渗透。值得一提的是，除了 AI 手机，AI 浏览器也在试水。浏览器是 PC 端的超级流量入口，它不仅仅是用智能体代替浏览器插件（比如网页总结、操作网页、推荐相似网页），而且将对话智能体的交互方式完全植入进搜索页面，实时唤起、多轮对话。QQ 浏览器、Genspark、Fellou、Perplexity 是目前的演进产品代表5。（三）全景坐标：容错性 + 自主性科技与市场之间的关系错综复杂，如果仅停留在单一角度分类智能体是非常片面的，为了更全景地认知理解智能体，我们对从业者进行了广泛的调研采访。综合各方观点和认知，我们认为可以从“容错性”“自主性”两个维度划定坐标轴，建立智能体的价值生态。X 轴是“容错性”，这是智能体未来发展的核心竞争指标。容错性低，通常意味着出现错误后果严重，其使用场景需要更准确的信息捕捉、归纳、整合能力，更少的幻觉和错误决策，更稳定的执行任务能力，比如医疗；而容错性高的领域，错误后果轻微且可控，人类能方便地介入调整，比如写作创意。Y 轴是“自主性”，是在不同场景中智能体的行动边界。自主性衡量的是智能体在没有直接人类干预的情况下，自主做出决策和执行动作的能力。更高的自主性通常意味着更高的工作效率和处理复杂任务的能力，但同时也显著放大了错误或滥用行为可能造成的后果。围绕智能体的容错性和自主性建立模型，任何智能体都能在坐标空5[ 吴一凡 . 腾讯、阿里和字节都在布局 AI 浏览器，它会是 PC 端超级入口吗？｜ AI 浏览器（上）[EB/OL]. （2025-06-25）. https://mp.weixin.qq.com/s/YbMI3Tl4cV0cIEFlROTosw.] 9间里找到属于自己的位置。这是我们衡量智能体的方法论。在这一全景坐标下，讨论智能体安全合规问题，能带给隶属不同象限的智能体产品更适配的安全风险准则。 10访问21财经App智库频道获取更多报告 http://m.21jingji.com/thindtank02现在到了谈安全合规的时候吗？ 11随着智能体的产业生态和应用场景逐渐清晰，担忧的声量随之而来，声音来自两边：一边认为一旦智能体出现安全事故，后果难以控制，急需设置防护栏；另一边则认为，智能体的当务之急是发展技术，对安全的过度讨论会阻碍创新。每一轮技术浪潮袭来，此类发展和安全的争端都不鲜见。亟需找出

点击免费查看完整报告

智能体体检报告

你可能感兴趣

川普体检报告

深度报告：财务全体检，高ROE、高分红、高成长、有潜力

山东区体检人群健康报告（2023版）

2021版上海百万城市体检人群健康报告

健康体检行业点评报告：爱康国宾私有化进程更新及对体检行业的影响讨论

体检行业深度报告：连锁化和多元化加速

2024版0岁及以上体检人群健康报告

2024上海市体检人群抽样健康报告

A股大牛市：一份全面的体检报告

房地产行业报告22城试点建立房屋体检、房屋养老金和房屋保险制度