
White Paper on the Governanceof Invasive Agents,2026 FROST & SULLIVAN WHITEPAPER ◼引言 ◼侵⼊式Agent打破互联网体系的治理与信任边界 随着多模态模型具备理解屏幕与界面的能力,侵入式Agent可在未获授权的情况下读取敏感信息并跨应用执行高敏操作。这种绕开平台接口的侵入式路径打破既有权限与治理边界,诱发平台与智能体对抗,并冲击互联网信任体系。 2025年底至2026年初,Agent技术从概念验证进入产品阶段。谷歌在安卓系统引入Gemini,构建底层界面自动化框架执行跨应用任务,确立了系统级操作的新范式。同期部分缺乏约束的实 现 方 式 快 速 扩 散,例 如 开 源Agent项 目OpenClaw获取高级权限后接管本地软件,在无用户确认时执行指令并引发数据误删事件。这些进展表明人工智能已经深度介入设备操作路径,具备代为执行复杂任务的能力。 ◼侵入式Agent改变传统流量分发路径 侵入式Agent将用户任务起点从应用入口前移到系统级智能体,用户不再先选App,而是直接下达任务,由智能体跨应用执行。这会削弱应用直接服务用户的能力,使导航、推荐与商业化入口被压缩或绕过,入口价值随之下滑。 ◼侵入式Agent加剧生态内卷 侵入式Agent本质上仍然是在原有生态里面的筛选行为,并不是做增量,是典型的内卷行为。 部分Agent技术跨越标准应用接口,依赖系统权限直接读取屏幕并模拟操作,构成了侵入式的交互特征。该机制改变了传统应用生态的操作入口,将流量分发与决策权转移至系统层级。在缺乏规范化管理时,此类侵入式操作显著增加了隐私泄露、资产损失与责任界定不清的系统风险。本报告聚焦侵入式机制对产业流量与商业分配的影响,剖析安全合规隐患,并提出产业生态治理方向。 ◼侵入式Agent削弱生态创新活力 侵入式Agent的路径选择以历史表现与可靠性为先,流量会向少数确定性高的应用集中;新应用缺乏可验证的先验与数据积累,更难进入推荐与调用链路,创新活力因此被压缩。 ◼侵入式Agent抬高生态综合治理成本和市场交易成本 侵入式Agent接管流量路由后,将原本清晰、标准化的分发关系前移到系统层重新裁决,直接推高搜寻、谈判、监督与合规成本,形成长期性的交易成本上升。 ◼通过构建全链路可审计的体系协助Agent负责任落地 侵入式Agent要实现可持续落地,关键在于把能力收敛到任务级最小权限,并对所有跨应用操作实现全链路可审计。只有让操作边界可控、执行过程可观测、责任主体可追溯,才能在提升自动化效率的同时把隐私与安全风险压到可管理范围。 ◼构建API主导,GUI辅助的双重授权治理方式以发挥Agent全量价值 API主导、GUI辅助的治理策略,本质是在双重授权的前提下将跨应用执行分层。可标准化、可审计的操作优先API,API覆盖不到的长尾环节才允许GUI,同时对GUI施加更严格的权限确认与审计约束。 ◼目录 章节1AI Agent产业发展现状4 1.1AIAgent产业概览51.2按技术路线划分:GUIAgent与APIAgent71.3按生态影响划分:侵入式Agent与合作式Agent121.4企业开发侵入式Agent路径的核心动因16 章节2侵入式Agent冲击商业生态19 2.1侵入式Agent掌握流量控制权202.2侵入式Agent加剧生态割裂29 章节3侵入式Agent的内生技术风险36 3.1侵入式Agent的数据隐私与安全风险373.2侵入式Agent的任务执行风险423.3侵入式Agent的风险案例45 章节4AI Agent时代的未来治理路径49 4.1国际治理路径参考504.2构建权限审计透明与统一API主导的双重授权治理框架53 01AIAgent产业发展现状 侵入式Agent路径打破传统App生态边界与信任体系 ◼侵入式Agent无需应用接口即可获取跨应用执行权◼侵入式Agent抢占用户的第一触点◼软件应用的系统权限边界被重构◼软件生态的行为不确定性上升 1.1.1 AI Agent概念定义 AIAgent是一种能够感知外部环境、自主制定决策并执行具体操作的智能系统。相较于传统AI,AIAgent具备自主推理与任务规划能力,能够独立完成复杂目标。 AIAgent是一个自主控制各类工具解决问题的Agent系统。一个基于大模型的AIAgent系统包括大模型、记忆系统、工具使用四大核心组件,运行机制大致为:输入请求→大模型理解请求→规划模块分拆任务步骤→记忆系统提供上下文→工具集成执行任务→感知与观测获取环境信息反馈→验证规划的步骤已执行→输出结果。 AIAgent分类体系主要围绕技术实现路径与生态影响模式展开。按技术路径,分为APIAgent与GUI Agent两类。API Agent依托标准接口传输结构化数据,功能边界受限于第三方开放度。GUI Agent通过解析屏幕并模拟触控,具备跨软件的泛化操作能力。按生态影响模式,AI Agent分为工具类、合作式与侵入式三类。工具类Agent在自有生态或本地环境闭环运行,不涉及第三方交互,安全可控。合作式Agent遵循双向授权原则,基于互信机制协同操作,维护行业秩序。侵入式Agent在未经第三方授权时,跨应用调用底层权限。此行为打破了既有服务闭环,极易引发无止境的技术攻防对抗,最终导致生态割裂与用户体验下降。 1.1.2 AI Agent市场规模 全球AI Agent市场正迎来倍数级扩张。海外市场依托标准化的应用程序接口规范维持领先地位。中国市场由于底层系统缺乏互通,规模化落地主要表现为垂直行业的深度定制。 全球通用型AI Agent市场在2025至2026年间正处于高速增长期。全球月活跃用户预计将从2025年1月的2亿增至2026年12月的5.3亿,整体增幅超过一倍。在市场总量扩大的同时,各区域的增长表现差异显著。中国市场的用户占比预计从2025年初的28%逐步降至24%,海外市场份额则从72%提升至76%。这一趋势表明,海外市场未来三至五年的增长速度与普及率将持续高于中国市场。 的程序接口规范,为AI应用提供了易于接入的数字环境。这让AI Agent能够以较低的边际成本融入企业现有的工作流程,快速转化为实际生产力。相比之下,中国企业级市场的软件环境较为分散,定制化开发比例高,各系统接口之间缺乏互通。这种结构限制导致通用型AI Agent在中国企业的部署成本增加且适配困难,最终影响了规模化应用的推进速度。 区域增长差异的根本原因在于底层软件架构的不同。海外市场具备成熟的软件服务体系和标准化 1.2.1 GUI Agent与API Agent的概念定义 APIAgent通过程序接口实现协议通信,GUI Agent通过模拟用户界面进行交互,这两类技术路径可独立或协作完成跨系统的复杂任务。 在互联网生态中,跨平台数据协同是数字服务的核心。网站与应用程序通常需要接入第三方数据源来构建服务闭环。出于数据主权、商业利益及合规性等因素,许多数据资源留存于相互独立的系统之中。这种数据隔离的现状,使得外部系统实现跨域共享面临一定挑战。 与人类相同的视觉路径完成跨系统任务。 API与GUI在技术特性与生态治理维度上存在显著差异。API Agent侧重于结构化交互,通过后端协议直接通信,确保了传输的精准度与效率。这种模式通常需要用户与平台方的共同许可,属于典型的合作式路径。这种合作模式尊重原开发者的商业利益与知识产权,有助于维护数字生态的稳定性。与之相比,GUIAgent虽然具备较强的泛化能力,能够操作各类可视化界面,但其授权机制存在明显分化。其中一类是获得了平台授权并在互信机制下运行的合作式GUI。另一类则是未经第三方应用程序开发者授权,利用超级底层权限强行介入的侵入式路径。 目前主要通过两种路径解决这一问题。首先是应用程序编程接口,即API Agent架构。它依靠预设的接口规范和通信协议,为第三方系统提供可控的访问入口。这种方式满足安全审计需求,并能确保服务方对数据调用的可追溯性。其次是图形用户界面交互,即GUIAgent方案。这种方式不依赖API接口,而是通过启动操作系统级无障碍服务来模仿用户的界面操作。其逻辑在于AI能够通过 (3)在执行效率方面,API Agent可通过一次精准调用就完成复杂任务,后端直接驱动执行效率高,但GUIAgent哪怕是在完成简单任务时,也需要经过多次截图分析、视觉推理等复杂计算,效率低且算力消耗大。例如:当你需要在手机上设置 一 个12月12日 晚 上 八 点 的 会 议 提 醒 时,APIAgent仅需调用一次API并进行适当的认证即可创建事件提醒,但GUI Agent需要打开日历,通过视觉导航填写相关字段,并点击按钮完成会议详情设置。 对比两种AI Agent范式,GUI Agent的核心优势在于通用性高,但在可靠性、效率性、安全性等方面弱于API Agent。 (1)在通用性方面,相较于API Agent的拓展依赖于创建和部署的额外端点,GUI Agent因不需要与应用程序开发者进行适配,理论上用户可使用的程序,GUI Agent都能使用,解决了应用覆盖率的问题,对新功能或未暴露功能的适配能力也更强。 (2)在可靠性方面,因目前大模型技术对复杂界面的识别准确率尚未达到100%、需模拟用户的多个操作导致风险累积、界面改版时可能导致失效等,GUI Agent执 行 复 杂 任 务 的 失 败 率 较APIAgent高。 (4)在隐私性方面,不同于API Agent的应用端后台对数据和权限进行精细化管理,GUI Agent因需要读取屏幕内容,容易暴露敏感信息,导致隐私风险高。 1.2.2 GUI Agent市场规模 全球GUI Agent市场在2025至2026年间高速增长,中国市场受移动应用环境封闭与厂商系统级预装策略共同驱动,其普及速度与全球份额占比均实现显著提升。 全球GUI Agent市场的活跃用户量在2025年至2026年间将呈现显著上升趋势。该领域的月活跃用户总数预计将从2025年1月的0.02亿增长至2026年12月的0.49亿。与通用型市场占比下滑的趋势不同,中国在GUI Agent领域的市场占有率将从29%稳步提升至36%。与此同时海外市场的占比将从71%下降至64%。这种结构变化表明中国正在成为该技术方向增长的主要推动力量。 中国移动互联网的应用环境具有较强的独立特征,各软件之间缺乏标准的数据互通机制。这使得通过视觉模拟来实现跨软件操作的GUIAgent成为解决系统协作问题的主要方式。此外中国厂商在技术普及方面表现得更为积极。相比海外开发商较为审慎的商业化态度,国内手机与操作系统厂商倾向于在系统基础层面直接预装相关功能。这种由系统供应方直接提供的推广模式能够更快让用户使用,从而在短时间内推动了市场规模的迅速增长。 中国市场在GUI Agent领域的普及优势主要源于其独特的移动互联网环境与硬件厂商的推广策略。 1.2.3 GUI Agent产业发展历程 GUI自动化早已有之。自2023年起,多模态理解与跨环境泛化显著降低GUI Agent开发部署门槛;2025年,手机AI助手、豆包手机助手、AutoGLM等GUIAgent相继发布。 自2024年起,基于原生多模态大模型的范式成为行业主导。在该模式下任务呈现端到端的学习与执行特征,将信息感知与逻辑推理以及记忆行动深度整合于单一模型内。这种数据驱动的本质使GUIAgent能够自主适应全新任务与未知界面,彻底脱离了对人工预设规则的依赖,极大提升了产品的业务拓展能力。同年后期,海外领先厂商发布了具备系统级计算机操作能力的视觉大模型,能够自主识别屏幕元素并完成跨软件任务,标志着该技术正式走向商业实用阶段。随后集成了专属交互模型的智能Agent产品相继问世,系统不仅开放了底层开发接口,还能完全模拟人类行为进行网页浏览与信息