中国AI代理的当前状况 ⾏业更新 由于⽆法进⼊封闭花园,⾯向消费者的AI代理⾯临重⼤挑战;企业可能成为AI代理的早期采⽤者。 中国科技积极的 中国科技 焦韶, 特许⾦融分析师 +1 212 526 5562 jiong.shao@barclays.com BCI, 美国 巴克莱研究不覆盖以下公司:[Anthropic, ByteDance, DeepSeek, Kunlun, MiniMax, Moonshot AI, Monica, OpenAI, Zhipu]。有关这些公司的信息仅供参考,并不构成巴克莱研究的投资建议。 段连岫(罗杰)+1 212 526 4633 lianxiu.duan@barclays.com BCI, 美国 ⾃2025年3⽉起,中国多家公司推出了通⽤⼈⼯智能代理⼈Manus,包括字节跳动、阿⾥巴巴、腾讯等科技巨头,以及Zhipu、Moonshot AI和Minimax等⼩型初创公司。 宋新尧+1 212 526 6972 xinyao.song@barclays.com BCI, 美国 我们尝试了中国所有领先的⼈⼯智能代理,并将它们与ChatGPT的⼈⼯智能代理进⾏了⽐较。在本报告中,我们总结了我们的发现。 除Manus外,中国所有⼈⼯智能代理均基于各公司⾃有的专有基础LLMs。⼀⽅⾯,我们⼀直在论证LLMs在能⼒上似乎越来越相似,单个LLM可能并⾮⼈⼯智能代理受欢迎或被采⽤的关键区别因素。拥有最好的LLM对于⽬标⽤⼾,尤其是可能更看重易⽤性等其他因素的消费者⽤⼾的价值可能微乎其微。另⼀⽅⾯,对于构建其⼈⼯智能代理的初创公司来说,即依赖⼤型科技平台等他⼈的LLMs,⼀旦LLMs不始终可供⼈⼯智能代理使⽤,未来可能存在存在性⻛险。 ChatGPT的深度研究)和编码(例如GitHub Copilot)。 但是,普通用途的AI代理的进展一直很缓慢(在AI领域)。 尽管专门的AI代理可以在几分钟内为复杂程序编写代码,而ChatGPT的深度研究可以轻松编写一份卖方类型的研究报告,但今天没有一个AI代理可以执行简单的任务,例如在亚马逊上购买一台MacBook Air 15。 这个简单的任务不需要思考或推理,但由于许多原因,今天最聪明的AI代理也无法完成-亚马逊为什么要提供访问未经亚马逊授权的AI代理? 同样,在中国互联网行业的“围墙花园”(阿里巴巴的电子商务,腾讯支付,美团外卖)限制了AI代理的使用,除非进行特殊的合作和交易。 另一方面,企业可以更容易地采用当然定制为各个企业、具有内部数据、专有的人工智能代理 巴克莱资本股份有限公司及/或其关联公司已经并寻求与其研究报告中涵盖的公司开展业务。因此,投资者应意识到该公司可能存在利益冲突,可能会影响本报告的客观性。投资者应该将本报告仅视为作出投资决定的⼀个因素。 请参阅第28页开始的分析师认证和重要披露事项。已完成:11-Aug-25, 00:45 GMT 发布⽇期:11-Aug-25, 10:00 GMT受限制 - 外部 ⼯作流程和企业资源规划需求。在企业领域,由于访问外部专有信息的需求⾮常有限(每个AI代理都可以访问外部公共信息),在AI专家的帮助下(例如阿⾥巴巴、字节跳动、京东等),企业可以开发⼀系列AI代理,从⽽显著提⾼⽣产⼒和效率。最近的媒体报道称,中国⼏乎有200家企业和政府实体在2025年上半年⾄少花费了总额⾄少11亿元⼈⺠币(1.5亿美元)与DeepSeek合作进⾏各种项⽬(稍后在报告中讨论)。在本报告中,我们概述了教育、医疗保健和供应链管理等领域的若⼲⽤例。投资者之间对于企业认真采⽤AI代理谁将受损⼀事有很多讨论,明显的候选者包括内部和外包程序、企业软件公司等。 尽管存在着重大挑战,尤其是对面向消费者的AI代理,我们相信企业和消费者对AI代理的采用可能会比美国等市场更快,因为中国的推理成本大约比美国低90%。随着AI代理的普及,对推理的需求可能会大幅增加。与所有技术采纳曲线一样,拥有较低成本往往会激发采纳速度。终端用户(企业和消费者)更快地采纳,反过来应该会加快基础LLMs和单个AI代理的优化速度。最后,我们继续相信终极的AI赢家可能需要拥有设备组合(例如AI眼镜)。 ⽬录 中国AI代理商对消费者的重要观点 4 回顾:AI代理商如何运作 4中国AI代理商发展的关键要点 4AI代理商展⽰ - 预订团队晚餐 8AI代理产品概述 10 AI代理的发展得到了成本效益特性、技术创新和⼯具⽣态系统拓展的⽀持 LLM12 关键要点 12最新的中国LLMs创新和价格 14 在企业层⾯,由于定制,代理商是实⽤的;地⽅政府和国有企业正在积极部署AI模型 16 智能眼镜 - AI与物理世界的整合 21 详细介绍AI代理和基础LLM 21 Manus(莫妮卡,未涵盖) 21AutoGLM反思(智谱,未涵盖) 22MiniMax代理(MiniMax,未涵盖) 23Kimi-研究员(Kunlun AI,未涵盖) 24Skywork超级代理(昆仑,未涵盖) 24Coze Space(字节跳动,未涵盖) 25Xinxiang(百度) 26夸克(阿⾥巴巴)26腾讯AI智能体(腾讯)27 消费者从中国AI代理中获得的关键要点 回顾一下,AI代理是如何工作的? AI代理被视为⼈⼯智能的下⼀个演进阶段。与仅⽣成响应的传统聊天机器⼈不同,AI代理可以独⽴执⾏任务以实现既定⽬标,通常通过推理、规划多步⼯作、与⼯具交互、检索和存储信息在记忆中,并根据输⼊变化进⾏⾃适应,减少⼈类监督。⼯作流程通常始于输⼊-例如⽤⼾查询或系统事件-由LLMs处理以解释并决定具体操作。然后代理可能与外部⼯具、API或⼈类交互以收集信息、执⾏命令或执⾏现实任务。在整个过程中,记忆模块可能存储过去的互动和⼯具结果以提供背景。 因此,LLM的作⽤类似⼤脑。⼯具可以是代码执⾏模块、⽹络搜索和第三⽅服务,如天⽓API和预订API。API将代理连接到外部服务。2024年11⽉,Anthropic发布了⼀个名为模型上下⽂协议(MCP)的开源框架,以标准化将AI模型与外部⼯具、系统和数据源集成共享的框架,该框架已被OpenAI、Google和许多全球公司迅速采纳。在中国,阿⾥巴巴、腾讯和百度正在部署基于MCP的服务,这⼀趋势可能会提升AI代理的⼯具执⾏能⼒。 ⼀般来说,AI代理在沙箱中运⾏-⼀个在云端的虚拟计算机,与主机系统隔离运⾏。代理会向⽤⼾展⽰他们的⼯作过程,例如在检索信息的⽹站窗⼝中,当必要时需要⽤⼾信息来执⾏任务。 图1. AI代理工作流程 中国AI代理发展的关键要点 •中国AI代理通常建立在内部LLM上,它们在全球顶尖模型性能方面取得了成就,但仅需占输出成本的约10% 随着过去两年持续的投资和发展,LLMs已经演变成科技公司中不可或缺的商品之⼀,除了Manus, 它构建在Anthropic的Claude和阿⾥巴巴的Qwen模型之上,并正试图通过更好的⽤⼾体验和产品演进来建⽴⾃⼰的壁垒。 ° LLMs是基础。代理的规划能⼒,推理质量,⻓⽂本处理,⼯具使⽤精度和多模态能⼒直接受限于其基础模型。处理,⼯具使⽤精度,和多模态能⼒直接受制于其基础模型。 阿⾥巴巴的Quark(升级⾃带有⼈⼯智能功能的搜索引擎)于3⽉推出,字节跳动的Coze和百度的Xinxiang于4⽉推出。它们在⽣态系统中具有巨⼤优势(专有应⽤程序、云、⽤⼾流量和LLMs)。 •初创公司擅长产品创新,尽管在与大型科技公司相比工具集成的生态系统优势上存在不足 阿⾥巴巴的Quark(升级⾃带有⼈⼯智能功能的搜索引擎)于3⽉推出,字节跳动的Coze和百度的Xinxiang于4⽉推出。它们在⽣态系统中具有巨⼤优势(专有应⽤程序、云、⽤⼾流量和LLMs)。 ° 然⽽,在我们看来,AI代理对消费者更多地关乎产品开发 流程,如⼯作流设计、⼯具操作、多模态集成、多智能体协作和沙盒操作。从这个⻆度来看,智璞、昆仑、MiniMax 和 Monica 等公司正在提供积极的⽤⼾体验并快速改进(图5)。 另⼀⽅⾯,阿⾥巴巴、腾讯、百度和字节跳动等⼤型科技公司在⼈⼯智能智能体开发平台⽅⾯取得了进展(图6)。⼈们主要通过对话和⼯具选择来构建和定制⼈⼯智能应⽤/聊天机器⼈,⽽不是编码。 AI代理开发平台的进展(图6)。⼈们可以主要通过对话和⼯具选择来构建和定制AI应⽤程序/聊天机器⼈,⽽不是编码。 •深度研究、网页浏览、文件/网页生成是标准功能;输出质量和用户体验区分这些智能体 ° 作为中国⾸个实⽤通⽤⼈⼯智能智能体,Manus 在3⽉份推出,可以处理各种⽣活/⼯作场景。6⽉份,Manus 开始提供名为 Playbook 的⼈⼯智能智能体模板,以标准化输⼊/输出解决⽅案。 ⼴泛的⽣活/⼯作场景。六⽉份,Manus开始提供名为Playbook的AI代理模板,以标准化输⼊/输出解决⽅案。 ° 此后,智璞的⼈⼯智能智能体 AutoGLM Rumination 在3⽉底推出,可以深⼊研究⽹⻚、视频甚⾄ RedNote ⽹站上的⽤⼾评论,然后⽣成设计精良的幻灯⽚,⾮常适合需要⽹⻚交互的任务,如产品⽐较和旅⾏规划。 进⼊RedNote⽹站的⽹络、视频甚⾄⽤⼾评论进⾏研究,然后⽣成⼀个精⼼设计的数据集,使其⾮常适合需要⽹络交互的任务,如产品⽐较和旅⾏规划。 ° 昆仑的⼈⼯智能智能体 Skywork 在5⽉份推出,进⼀步优化了深度研究过程为避免冗余/⽆关的研究。它在第⼀步中拆分任务,要求⼈们进⾏调整或批准,然后执⾏任务。在研究过程中,它还与⼈类互动以优化结果。它允许在知识库中上传本地⽂件,因此分析可以基于专有数据。 ° MiniMax的AI代理,在六⽉推出,具有⻓上下⽂窗⼝的效率,主动测试和检查其⽣成的结果。Moonshot的AI代理Kimi-Researcher,在六⽉推出,可以主动识别数据异常并追踪原始来源进⾏验证。 °这并不意味着最新的代理在每个⽅⾯都胜过以前的代理。事实上,我们认为所有代理在这些基础研究/⽹络/⽂件⽣成任务中都有很⼤的改进空间,以提供⾼质量的输出和更好的⽤⼾体验。 •多模态能力是扩展用例的关键 °多模态能⼒在主流LLM中相当普遍。例如,阿⾥巴巴的Qwen,百度的ERNIE,腾讯的Hunyuan,字节跳动的Doubao,以及⼤多数初创公司的模型都提供了多模态功能。 从⼤多数初创公司的模型,都提供了多模态功能。 °在代理⽅⾯,我们认为智普的AutoGLM设计⽤于理解视频内容可以帮助⽤⼾节省⼤量时间。昆仑的Skywork可以处理⾳乐、视频、⾳频和图像,并具有出⾊的质量。MiniMax在多模态能⼒⽅⾯表现突出,尤其是在制作⽹⻚时,例如⽣成图像和⾳频,将内容与正确的位置匹配。 •工具使用是一个"真正代理"的下一步,从思考、行动到交付结果 ° 确实,全球主要的AI参与者正在加速代理⼯具使⽤能⼒的开发。虽然⼤多数代理能够检索⽹络信息并与⾮交易相关的⼯具进⾏交互,但我们认为智谱的AutoGLM Rumination在直接执⾏本地⽹络操作⽅⾯表现突出,如代表⽤⼾发送电⼦邮件;百度的新乡在规划⾏程时利⽤⽣态产品,如百度地图;腾讯在其代理开发平台上提供微信⽀付MCP;Manus能够代表⽤⼾在RedNote⽹站上留⾔并获得授权。 ° 然⽽,在⼤多数现实世界案例中,当前AI代理⽆法访问许多 应⽤程序,如电⼦商务应⽤程序/⽹站,OTA,⻝品送餐平台,因此,只需“⼀个提⽰来要求代理下单到家”仍然是⼀种理想化的幻想。 ° 许多代理已经开始⽀持全球MCP标准与外部⼯具进⾏交互和共享数据,如GitHub,Slack和YouTube。MCP池仍然很⼩,主要包括办公和⽹络浏览⼯具,⽽不是交易相关的应⽤程序。⽬前,代理通常⽆法取代⼿动操作,更专注于信息检索。但趋势⾮常明确,代理正在从思考、⾏动到产⽣结果的演变。 ° 许多代理已经开始⽀持全球MCP标准以交互和共享数据 与外部⼯具,如GitH