您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [阿里巴巴]:Agent新春特刊:智能体的形态演进与治理思考 - 发现报告

Agent新春特刊:智能体的形态演进与治理思考

信息技术 2026-03-04 - 阿里巴巴 任云鹏
报告封面

智能体的形态演进与治理思考 (2026年2月) 前言 2026年开春,AI Agent(智能体)在产业长久期盼后,迎来了从“想象”到“落地”的转折点:在国际展会中,搭载Agent能力的AI手机、眼镜、智能车机及各类智能家电密集面世;在北美,Cowork与OpenClaw爆火,直接重构了北美资本市场对SaaS软件的估值逻辑;在中国,豆包手机和千问Agent前后面世。尽管Agent的形态和评价截然不同,但都意味着Agent开始成为统一入口,改变移动互联网的商业模式和与APP的合作边界。一个明确的信号已传导至公共政策研究领域:AI正式告别了“对话框”,步入以“能思考、能办事”为核心特征的智能体时代。 本期新春特刊将解析这些产业“黑话”,穿透热点和争议,尝试勾勒出一幅Agent发展和治理的“全景航向图”。 首先是Agent硬件。通过对CES与深圳硬件展的复盘,我们看到智能体正“寄宿”于手机、眼镜、汽车、家电甚至机器狗等物理载体,通过全端协同和全局记忆,让各类硬件可以“组队”为用户提供主动服务,而中国企业则以“以算法替代高精度器件”的策略,把坚持精密制造的欧洲甩在身后。 然后是Agent软件。在生产力领域,Agent通过代码提升了复杂意图的理解和复杂任务的分拆能力,再通过MCP、Skills等“脚手架”调用万物,让CoWork和OpenClaw从开发者出圈到所有“打工人”;在消费领域,电商形态正从电子贸易(e-Commerce)向智能体贸易 (Agent Commerce)迁移,这种从“人货匹配”到“Agent决策商品和服务消费”的变迁,将突破电商行业的容量上限,并可能改变移动互联网的合作格局。 最后是Agent治理。在Agent安全领域,我们提出了三层架构,并特别说明了“全端协同”、“全局记忆”带来的增量风险,而Agent能力显著提升,可以完成更多原先只有人类才能完成的工作,改变了人机交互的边界,必然引发伦理争议和难题。哪些工作只有人类才能完成、Agent不能代劳?哪些话语Agent不适合对人类表达,哪些人类价值观Agent需要遵守?我们将以AI商业化和“一老一小”两个特殊群体入手,给出Agent行为规约的样例;在Agent出海方向,我们解析了Manus被出口管制的政策逻辑,但也讲解了Manus在国内可能遇到的经营挑战,提出要支持科创企业在国内与海外“双轨”运营。 希望通过这五篇深度分析,能够与诸位专家同好一起,总结技术表象背后的产业逻辑,探讨Agent时代公共政策的新锚点。而最重要的,是共同迎来2026年AI产业发展与治理的新篇章。 目录 一、Agent硬件:智能硬件产业“大对账”:中美两场展会折射出的趋势、差异与思考.........................................................5 二、Agent软件-生产力:从OpenClaw爆火,看代码数据的价值与软件行业的重构.......................................................16 三、Agent软件-消费:从E-Commerce到AgentCommerce:迎接电商生态的整体升级.................................27 四:Agent安全:AI智能体服务产业观察与安全初探......42 五、Agent出海:Manus事件的起因、走势以及启示........55 智能硬件产业“大对账”: 中美两场展会折射出的趋势、差异与思考 2026年1月,全球智能硬件产业迎来两场重磅展会:美国拉斯维加斯的CES 2026与深圳阿里云智能硬件展同步启幕。太平洋两岸的科技季风从未如此同步,从全球首款AI吉他、到长出机械臂和机械腿乃至飞行器的扫地机器人,从智能眼镜与车机无缝交互、到全屋智能家电的功能联动,从人形机器人与人类拳击手对练闪避、到助盲眼镜毫秒级实时避障,只要能想象到的物理交互场景,就有可能在发生。这两场展会不仅集中展现了人工智能与硬件融合的最新成果,更是一份全球智能硬件产业的年度“大对账”,折射出国内与海外在创新逻辑、市场生态与治理理念上的共性趋势与显著差异。 阿里研究院本次派出研究人员亲赴现场,通过对两场展会的深度观察与对比分析,提炼出六大核心发现,以期透过展会表象,洞察产业深层趋势,为中国智能硬件的高质量发展提供参考。 一、发现一:“全端协同+全局记忆”成为智能硬件的共性发展趋势 美国CES 2026上,谷歌Gemini模型与三星展示了典型的联动场景:用户在电视看到特色菜,系统自动调取冰箱食材数据、向手机推送定制菜谱、同步预热烤箱。这彻底改变了过去“单品智能”的割裂体验,实现了跨设备完成同一目标的高效配合。三星计划2026年将谷歌Gemini引入8亿台电子设备当中,以构建一个全端协同的硬件智能体生态。深圳硬件展上,理想展示了“理想同学”在外卖闪购、停车缴费等场景的丝滑表现。通过跨设备(眼镜/手机/车机)、跨应用的显式记忆和从对话中学习的隐式偏好,实现对用户意图的深度理解,统筹调度地图、支付等专业智能体,完成复杂任务的动态编排。OPPO则发力“生活管家”、“生产力助手”、“影像搭子”三大关键赛道,通过对用户“察言观色”,理解和记录用户偏好,提出“感知-记忆-理解-执行”的循环飞轮,旨在打造一个“越用越懂你”的个性化生态。并展示了多个应用场景,如基于之前学习到的用户的饮食偏好,精准推荐附近餐厅;如基于用户使用习惯、位置、时间等多维度数据,主动弹出天气提醒、日程安排等个性化推荐。 由此,我们能理解“全端协同”并不是传统的物联网设备连接与遥控,而是指手机、眼镜、家电、车辆能够动态组队、各司其职,为用户提供连续的智能化服务;而“全局记忆”是 指在获得用户授权的前提下,让用户在A设备上养成的使用习惯,能够被B设备自动理解并适配,从而实现对用户意图的理解预判,从而进行主动服务。中美头部智能硬件厂商在这两个领域有高度共识,从“单品智能”加速向“全端协同+全局记忆”演进。 二、发现二:“出海验证,反哺国内”成为中国智能硬件发展的新范式 一批在海外获得成功的中国智能硬件企业,正系统性走通“国内研发—海外验证—规模成功—回国拓展”的闭环路径。 如深圳科技企业机智连接(Plaud AI),以创新性的卡贴式录音设备Plaud Note切入海外市场,2年内在欧美市场销量上百万台,是市场上公认的最成功的AI硬件之一,成为该赛道的统治级厂商。在验证了技术方案和商业模式后,于2025年10月“杀回”国内,开始布局拓展中国市场。如成都沸彻科技(FITURE),结合端侧视觉算法+云端大模型,开发的随身健身伴侣Body Park Atom,能够实时监测用户动作并语音纠正指导,在海外众筹平台爆火,成功验证场景需求真实性后,近期开始启动国内市场的推广工作。值得注意的是,上述出海企业具备极高的海外合规意识,并将欧美严格的用户隐私要求与数据跨境标准融入产品设计和运行流程。 这一路径揭示出,中国已经涌现出相当一批具备“从0到1”开创智能硬件新品类的科技企业。海外市场成为中国原创科技最好的“试金石”与“磨刀石”,企业带着成熟的产品定义、商业逻辑与合规经验回归,有效填补了国内市场的生态空白。从“三来一补”到“主动出海”到“生而全球化”,当前中国在智能硬件已进入科技实力“比较优势”向全球溢出阶段,具备整合全球产业要素,参与全球竞争的底气。为何这些“新物种”会选择欧美作为首发市场?我国本土产业环境在知识产权保护和服务付费商业模式接受度上,是否仍存在内外“温差”?值得进一步探讨。 三、发现三:AI陪伴赛道呈中低端同质化竞争局面,部分厂商的“一老一小”破局路径值得借鉴 本次深圳硬件展上,近百家AI陪伴硬件厂商参展,占据了全部展位的近三分之一。这种“扎堆”程度,也揭示出情感陪伴是人类的刚性心理需求。但大多数AI陪伴硬件无论是外观还是功能均高度趋同,普遍定位在陪伴聊天玩具,依托云端基础大模型进行情感交互,价位普遍在300元人民币左右区间,呈现中低端同质化竞争的局面。而部分厂商在“一老一小”两个特殊客群上的破局路径值得借鉴。 面向儿童群体,“汤姆猫AI童伴”与模型厂商联合研发情感陪伴垂直模型,深度植入了汤姆猫IP特有的人设性格,并 构建儿童专属的内容体系,将知识IP化、游戏化,如“魔力咒语”“趣味打断”等互动玩法,并能根据年龄自动调节认知难度。并通过持续提取对话关键词构建用户兴趣图谱与画像(如记住孩子的宠物名字、喜好),在后续交互中主动调用记忆实现“越聊越懂你”的个性化陪伴。结合其硬件在头部和手臂的多自由度以及丰富表情,将价位上攻到1500-2000元人民币区间。对儿童陪伴赛道,政策需注意AI拟人化和游戏导致沉迷或内容引导错误价值观不同,是健康陪伴类软硬件的必备能力。治理可侧重加强正向伦理引导与具体的行为规约,保护产业创新活力。 面向银发群体,在CES展会上,美国厂商TomBot推出定价1500美金的陪伴仿生拉布拉多幼犬,定位为阿尔茨海默症辅助干预器械,正致力于通过FDA的医疗器械许可,从而在养老机构实现规模化应用。而随着我国老龄化程度持续加深,国家统计局数据显示,至2034年,银发群体将扩容至4.1亿。阿里研究院预估,银发群体的精神情感类消费占比将从2023年的24%跃升至2035年的35%。阿里平台数据显示,2025年度,该群体智能玩具消费同比增长超2000%,AI陪伴机器人增长200%,有效缓解独居焦虑。对老人陪伴赛道,政策可考虑进一步支持相关企业联合医疗机构开展临床效果验证,试点探索将具备康复干预功能的AI陪伴硬件纳入医疗器械管理路径,并鼓励养老机构开放试点应用场景, 引导AI陪伴产品从同质化玩具向专业化服务载体有序升级,真正释放银发经济创新潜能,助力积极应对人口老龄化国家战略。 四、发现四:德国“精度至上”模式在AI时代已经掉队,中国硬件产业正构建创新优势 美国CES 2026具身智能展区,来自德国的高精度微型电机领军企业FAULHABER(福尔哈贝),展示了其微米级加工精度(0.01mm物理精度)的微型行星减速箱与驱动模组。延续了其作为医疗与航天领域“隐形冠军”的技术骄傲,以纯粹的机械美学,依靠硬件的完美精度来确保传动零抖动,并强调长达1年的打磨验证周期是确保品质的“必要代价”。其展台背景海报上的宣传语"Fine motor skills”(精细运动技能)与机器人拧魔方的画面,折射出其对硬件的深层看法:仍将具身智能视为更复杂的自动化设备,而非AI大模型的物理载体。这种源于工业时代的工程师思维与瑞士手表式力求精准的制造逻辑,在追求极致确定性的同时,对AI时代数据驱动、快速迭代“水土不服”,难以匹配当前智能硬件走向消费级市场的敏捷节奏。 与德国路径形成鲜明对照,中国智能硬件产业正在探索一条叠加我国供应链优势与大模型能力的差异化路径。在硬件侧,中国具备全球最完备且效率最高的硬件产业完整链条, 珠三角的核心零部件厂商可在2周内完成浙江机器人本体厂商的打样需求。在算法侧,中国模型已跻身全球头部,而token定价只有美国的1/20。中国工程师致力于将视觉伺服、力控柔顺、视觉识别、端到端模型融入控制系统,可以用0.1毫米精度的高性价比电机达到0.01mm精度昂贵电机同等的作业效果。不仅大幅降低了产品成本,更将产品验证周期从德国同行的12个月压缩至3个月。 上述产业实践为理解AI服务制造业提供了新的视角:如果仅在传统工业追求的极致标准化与规模化赛道上追赶,我们或难超越欧洲制造的壁垒。但通过算法的红利弥补精度的不足,用敏捷的试错迭代替代漫长的工业验证,这才是中国制造构建差异化新优势的根本路径。 五、发现五:多维感知引发多类型数据需求,相应的“高质量数据集”难以事先定义 两场展会均直观呈现了感知维度的爆发式扩张。CES2026上,“TouchDIVER Pro”触觉手套能够模拟压力、纹理、温度三类感官维度,带摄像头的耳机融合视觉与听觉模态