您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:计算机行业研究:端侧AI:超级入口争夺战 - 发现报告

计算机行业研究:端侧AI:超级入口争夺战

信息技术 2026-06-26 刘高畅,郑元昊,陈芷婧,孙恺祈 国金证券 记忆待续
报告封面

行业观点 GUI Agent彻底重构传统手机人机交互逻辑,打破移动互联网App孤岛壁垒,当前行业分化出GUI Agent、API Agent两条落地路线,二者长期互补共存。过往用户依靠手动点击App完成操作,各应用依托沙箱隔离构筑流量护城河,豆包手机助手依托字节大模型视觉、推理能力,搭配中兴/努比亚系统底层签名权限落地GUIAgent,可一键拆解多步骤跨应用任务,依托端云协同、持续数据迭代形成难以复刻的软硬一体工程壁垒。但该方案因绕过应用官方接口,上线后迅速遭到微信、支付宝、电商、银行类App风控屏蔽,本质是各方数据隐私、流量利益分配产生生态博弈。与之相对,微信小微采用API Agent路线,推出小程序自动、开发两类接入模式,吸引美团、京东、滴滴等平台入驻,配套AI支付卡搭建完整交易闭环。对比来看,GUI Agent无需厂商适配、覆盖全应用场景,但存在安全合规隐患;API Agent调用稳定、风险可控,更适配自有大型生态。后续随着监管出台互联互通规范,生态摩擦将逐步缓解,AI手机凭借全场景意图履约能力,成为新一代个人超级计算入口。AI超级入口重构全网流量分发格局,字节、腾讯、阿里形成三条差异化竞争路线,豆包牵手曹操出行落地打车 灰度测试,是AI智能体打通线下实体履约的标志性事件。2026年6月豆包小范围开放打车功能,由曹操出行承接运力,用户仅口述出行需求即可完成定位、估价、一键派单,实现AI从线上问答向物理服务延伸。短期来看,豆包庞大月活可为市场份额有限的曹操出行带来增量订单;中长期双方战略高度契合,曹操发布RoboX全域智能运力战略,规划2030年十万台Robotaxi、十万台Robovan部署,提前依托豆包培育用户AI叫车习惯,卡位无人运力时代需求入口。三大平台路线各有侧重:阿里依托支付宝、高德、饿了么搭建自营服务闭环,AI助手仅做服务导航规避金融风险;腾讯以微信小微为连接器,整合外部服务商形成完整交易链路;字节以豆包为通用入口,对外合作补齐本地生活、出行等外部服务。AI助手已成为继独立App后的核心流量阵地,生态闭环完善度、跨场景履约能力将决定平台长期竞争优势。 AI手机作为超级载体确立“大云小端”端云协同算力架构,同时带动全产业链与多品类AI终端市场扩容,打开长期产业增长空间。AI手机复杂意图拆解、Agent调度依赖云端大模型完成推理,端侧仅承载轻量化交互处理,行业所有AI入口产品均遵循该架构,云端算力需求随AI手机普及持续高增。硬件供应链层面,新一代豆包手机由中兴通讯联合打造,福日电子旗下中诺通讯负责ODM代工,手机放量将拉动芯片、屏幕、模组、代工整条产业链价值提升。从终端生态维度看,手机是覆盖全部C端信息流的核心载体,只有AI手机成熟落地,AI耳机、AI眼镜、AI PIN等轻量化终端才能依托统一生态实现规模化普及。Canalys行业数据预测,2024年全球AI手机出货占比仅16%,2028年渗透率将攀升至54%,持续拉动上下游算力、硬件需求。AI手机并非单一硬件赛道,而是整个端侧AI产业爆发的核心前置条件,其放量将同步催化云端算力需求、手机硬件供应链、多元AI终端三条主线同步景气,具备广阔产业纵深。相关标的 1)端侧:中兴通讯、曹操出行、腾讯控股、阿里巴巴、东阳光、瑞芯微、恒玄科技、全志科技、乐鑫科技、德才股份、美年健康、海康威视、大华股份、奥尼电子、中科创达、传音控股等;英特尔、高通、ARM、META等。 2)国内算力:寒武纪、海光信息、东阳光、禾盛新材、杰华特、利扬芯片、天数智芯、壁仞科技、芯原股份、百度集团、中芯国际、华虹半导体、华勤技术、浪潮信息、中国长城、网宿科技、华丰科技、星环科技、鸿日达、首都在线、神州数码、中科曙光、润泽科技、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能等。风险提示 AI手机产品迭代与放量不及预期的风险;平台封禁与生态博弈超预期的风险;数据隐私与监管政策的风险;合作进展与商业化不及预期的风险;AI产品可靠性与用户体验不及预期的风险;入口竞争格局变化的风险。 内容目录 一、入口革命:从"点击App"到"意图履约".........................................................31.1 GUI Agent重构人机交互逻辑,豆包手机突破应用壁垒遇生态博弈.............................31.2双Agent路线各有优劣,产业落地将互补共存...............................................4二、流量入口迁移的价值重估:豆包与曹操出行.....................................................72.1 AI助手首接线下履约,曹操出行借力超级入口重塑运力叙事..................................72.2三巨头AI赛道各展所长,入口竞争成行业核心焦点..........................................9三、超级载体的产业外延:大云小端与终端生态....................................................11四、相关标的..................................................................................12五、风险提示..................................................................................12 图表目录 图表1:豆包手机助手执行用户任务示意图........................................................3图表2:豆包手机封杀事件时间线................................................................4图表3:API Agent与GUI Agent在输入和输出上的区别.............................................5图表4:微信AI有两种接入模式,自动模式免开发,开发模式支持自主定制开发.......................6图表5:用户可在WorkBuddy上的“专家”页面召唤“美团生活助手”....................................7图表6:用户可以直接在豆包App内口述出行需求,系统自动识别起止地点、出行人数和用车偏好,自动匹配曹操出行运力,用户核对路线、车型和价格一键确认后即刻完成派单...................................8图表7:曹操出行发布RoboX战略,打造全域智能移动运力,开放运力供AI智能体调用...............9图表8:AI版支付宝邀测界面,AI助手阿宝可对话查询资产、规划理财..............................10图表9:小微能自动识别意图、调用对应小程序,完成从搜索、下单到支付的完整流程,支付环节仍需用户最终确认..........................................................................................11图表10:2028年,AI手机市场份额预计将达到54%..............................................12 一、入口革命:从"点击App"到"意图履约" 1.1GUI Agent重构人机交互逻辑,豆包手机突破应用壁垒遇生态博弈 GUI Agent的出现击穿了API时代形成的护城河,重构了人机交互的底层逻辑。过去十余年,移动互联网的交互范式以"图标点击"为核心:用户打开App、逐级菜单点击、手动输入完成操作,每一个超级App都是一座信息孤岛,应用之间的数据与服务壁垒构成了平台方的核心护城河。豆包手机助手基于豆包大模型在视觉理解、推理、GUI识别等维度的能力,将这一逻辑彻底改写——AI能够像人一样"看懂"屏幕上的UI元素,模拟点击、滑动和输入等动作,跨应用自主执行复杂任务。在官方演示中,操作人员仅用一句话表达意图,AI便在后台完成全部子任务的拆解与执行,涵盖"在地图上标记收藏餐厅、查询落地次日博物馆展览、在旅行平台订票并将信息整理到备忘录"等多步骤操作。这一范式切换的本质,是AI从"手机里的一个功能"升格为"贯穿交互的系统级调度者"。 这一范式切换的本质,是AI从"手机里的一个功能"升格为"贯穿交互的系统级调度者"。豆包手机助手并非简单的预装App,而是通过深度系统合作、获得系统级操作权限的AI助手,因而能避开传统App的"玻璃墙"限制,直接调用各应用功能。基于记忆能力,豆包手机助手还上线了操作手机Pro模式,除调用GUI Agent模拟点击外,还可直接调用系统工具,结合记忆数据与更强的推理能力完成复杂任务。值得强调的是,手机作为超级个人计算终端,承载了几乎所有C端的信息流,且是物理世界的超级入口,只有当AI击穿手机之后,其他AI终端才有可能依托AI手机持续繁荣。这也是我们将AI手机定义为"超级载体"的根本含义。 来源:极客公园,豆包手机使用指南文档,国金证券研究所 从现有形态看,AI手机已非"预装对话框",而是AI能力向操作系统层的深度下沉。以豆包手 机助手为例,其当前功能已覆盖跨应用操作(如比价下单、订票、信息整理到备忘录)、复杂任务自动拆解与执行、基于记忆的Pro模式(可直接调用系统工具),以及一句话发起的端到端履约。更关键的是其实现方式:有业内技术人员拆解发现,豆包手机助手通过中兴/努比亚用自有系统私钥签名,被设置为操作系统的一部分(而非外来的第三方App),并具备向系统注入模拟用户输入事件的底层权限,因而获得了丝滑、无感、不易被限制的跨应用操作体验,效果远超此前依赖安卓无障碍服务的端侧AI方案。这恰恰说明,AI手机要把演示效果稳定复现到真实场景,高度依赖软硬一体的工程化调优能力——系统权限的设计、底层事件注入、端云任务的调度切分、对各类App界面变化的实时适配、以及高敏操作的安全确认机制,每一环都需要操作系统、硬件与大模型团队的深度协同打磨,而非大模型厂商与手机厂商简单接入合作就能实现。 正因如此,我们看好豆包手机生态的重要理由之一,正在于字节在软硬一体工程化调优上的速度与领先性。依托豆包大模型的快速迭代、字节在C端产品上长期积累的工程能力,以及与中兴/努比亚的深度系统级合作,豆包手机助手在GUI识别、任务拆解、跨应用调度等环节的调优迭代明显快于行业平均水平,并已形成"用户使用—数据反馈—模型与工程优化"的数据飞轮。这种工程化壁垒难以被短期复制,是AI手机竞争中比单一模型能力更难逾越的护城河,也是我们判断豆包有望在AI手机这一超级入口卡位中占据先发优势的核心依据。 回看此前AI手机推进过程中遭遇的阶段性受阻,其根因并不在于AI能力本身,而在于App之间尚未形成顺畅的调用与数据流转。豆包手机限量发售后仅2至3天,微信、支付宝、美团、淘宝乃至部分银行App便相继对其自动化操作做了风控限制与屏蔽:有的触发安全风控导致登录异常,有的直接识别并拦截这类"代操作"行为。其深层原因在于,移动操作系统出于数据与隐私安全设计了沙箱隔离机制,App之间的数据天然互不可见,而开放接口、让渡数据与操作权限的主动权又掌握在各App厂商手中——这既涉及真实的数据安全与隐私合规考量,也牵涉流量入口与商业利益的再分配。换言之,AI手机的"超级入口"价值能否兑现,关键已不只是技术问题,而是生态各方能否在数据安全前提下建立起互联互通的协作机制。 我们认为,这一僵局有望随