您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[巴克莱]:中国ai智能体现状分析:消费级应用面临围墙花园挑战,企业级或成早期采用者 - 发现报告

中国ai智能体现状分析:消费级应用面临围墙花园挑战,企业级或成早期采用者

信息技术2025-08-11-巴克莱A***
AI智能总结
查看更多
中国ai智能体现状分析:消费级应用面临围墙花园挑战,企业级或成早期采用者

中国人工智能代理的当前状态 行业更新 面向消费者的AI代理由于无法访问围墙花园而面临重大挑战;企业可能是AI代理的早期采用者。 中国科技正面 中国科技钟少,CFA+1 212 526 5562 jiong.shao@barclays.com BCI,美国 巴克莱研究未覆盖以下公司:[Anthropic, ByteDance, DeepSeek, 昆仑, MiniMax, Moonshot AI,Monica, OpenAI, 智谱]。这些公司的信息仅供参考,并非巴克莱研究的投资建议。 连秀(罗杰)段+1 212 526 4633 lianxiu.duan@barclays.com BCI, US 自2025年3月起,当首个通用人工智能代理Manus发布以来,中国多家公司,包括字节跳动、阿里巴巴和腾讯等科技巨头,以及智谱、月之暗面人工智能和Minimax等初创企业,都已推出其人工智能代理。我们在中国尝试了所有这些领先的人工智能代理,并将它们与ChatGPT的人工智能代理进行了比较。在本报告中,我们总结了我们的发现。 新药宋 +1 212 526 6972 xinyao.song@barclays.com BCI,美国 除马努斯外,中国所有的AI代理都基于各自公司的专有基础LLM一方面,我们一直认为,大语言模型的能力似乎越来越相似,单个大语言模型可能并不是人工智能代理受欢迎或采用的关键差异点。拥有最好的大语言模型对目标用户来说可能意味着很小的价值,特别是对消费者用户来说,他们很可能会高度重视诸如易用性等其他要素,而远超过底层大语言模型的技术优势。另一方面,对于一个使用他人(例如主要技术平台)的大语言模型构建人工智能代理的初创公司来说,如果大语言模型不能始终向人工智能代理提供支持,那么在将来可能会存在生存风险。 我们已经看到了在特定领域的人工智能代理取得的显著进展,例如研究(例如ChatGPT的深度研究)和编程(例如GitHub Copilot)。然而,通用型人工智能代理的进展却很缓慢(在人工智能领域)。虽然一个特定领域的人工智能代理可以在几分钟内编写一个复杂程序的代码,并且ChatGPT的深度研究可以轻松编写一份卖方类型的研究报告,但今天还没有任何人工智能代理能够执行像“在亚马逊为我购买一台MacBook Air 15”这样的简单任务。这项简单的任务不需要思考或推理,但今天最聪明的人工智能代理也无法完成,原因很多,最显著的是——为什么亚马逊会提供对由亚马逊未制作的 AI 代理的访问权限?同样地,中国互联网行业中的围墙花园(BABA的电商、腾讯支付、美团外卖)限制了AI代理的使用,除非达成特殊合作和交易。 另一方面,企业采用针对自身企业并使用其内部数据和专有技术的AI代理将容易得多。 巴克莱资本公司及其附属公司中任一公司均与其研究报告涵盖的公司进行和寻求进行交易。因此,投资者应注意该机构可能存在利益冲突,从而可能影响本报告的客观性。投资者应将此报告视为其投资决策的单一因素。 工作流和ERP需求。在企业领域,由于访问外部专有信息的需求相当有限(每个AI代理都可以访问外部公共信息),在企业专家(例如阿里巴巴、字节跳动、京东等)的帮助下,企业可以开发一系列AI代理,以显著提高生产力和效率。最近媒体报道表明,中国近200家企业和政府机构已在2025年上半年总共花费至少11亿元人民币(1.5亿美元)与DeepSeek合作开展各种项目(报告后面将讨论)。在本报告中,我们概述了教育、医疗保健和供应链管理中的几个用例投资者们对此已经进行了很多讨论,关于企业认真采用人工智能代理后谁将成为输家,明显的候选者包括内部和外包程序、企业软件公司等。 尽管面临重大挑战,特别是对于面向消费者的AI代理,我们相信,企业消费者对AI代理的采用在中国可能比在美国等其他市场更快,因为中国的推理成本大约比美国的推理成本低90%。随着人工智能代理的采用兴起,推理的需求可能会大幅增长。在所有技术采用曲线中,成本较低往往会加速采用。最终用户(企业和消费者)的更快采用应反过来促进基础大语言模型和单个人工智能代理的更快优化。最后,我们继续相信最终的AI赢家可能需要拥有一个设备组合(例如AI眼镜)。 目录 来自中国AI代理消费者的关键要点。 . . . . . . . . . . . . . . . 4 后退一步,人工智能代理是如何工作的?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . .中国人工智能代理发展中的4个关键要点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..4 AI agent展示 - 预订团队晚餐. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8人工智能代理产品概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. .10 智能体开发得到经济高效的特性支持,LLM 在商业层面,代理人由于定制化而务实;本地 . . . . . . . . . . . . 16政府和国企正在积极部署AI模型 . . . . . . . . . . . . . . . . . 21AI眼镜 - AI与物理世界的融合 人工智能代理和底层的大型语言模型的详细介绍。 . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27曼努斯(莫妮卡,不包括)autoglm 反思 (智谱, 未涵盖)极小化极大代理(极小化极大,未涵盖)kimi-researcher (moonshot ai, 未包含)天空超级代理(昆仑,不覆盖)Coze Space(字节跳动,不包含)新翔(百度)夸克(阿里)腾讯AI助手(腾讯) 消费者从中国人工智能代理中得到的要点 后退一步,人工智能代理是如何工作的? 人工智能代理被视为人工智能的下一进化阶段。与传统聊天机器人仅仅生成回应不同,人工智能代理能够以自主的方式执行任务以实现既定目标,通常通过推理、规划多步骤工作、与工具交互、在内存中检索和存储信息,并根据变化的输入进行适应,仅需极少的人工监督。工作流程通常以输入开始——例如用户查询或系统事件——该输入由大型语言模型处理以解释并决定具体动作。代理随后可能通过外部工具或API或与人类交互来收集信息、执行命令或执行现实世界任务。在整个过程中,内存模块可以存储过去的交互和工具结果以提供上下文。 因此,LLM充当大脑。工具可以是代码执行模块、网络搜索以及天气API和预订API等第三方服务。API将代理与外部服务连接起来。2024年11月,Anthropic发布了一个开源框架“模型上下文协议”(MCP),用以规范AI模型与外部工具、系统和数据源集成和共享数据的标准框架,该框架已被OpenAI、Google以及众多全球公司迅速采用。在中国,阿里巴巴、腾讯和百度正在部署基于MCP的服务,这一趋势可能会提升AI代理的工具执行能力。 通常,AI代理运行在一个沙盒中——一个位于云端的虚拟计算机,它独立于主机系统运行。代理会向用户展示其工作过程,例如它们正在检索信息的网站窗口,并在需要时要求用户提供信息来执行任务。 图1。人工智能代理工作流程 源:巴克莱研究 关于中国人工智能助手发展的关键要点 •中文AI代理通常基于内部LLM构建,其已达到全球顶尖模型性能,但输出成本仅为~10% ° 无论是大型科技公司,还是主要的私营AI公司,都在其AI代理产品上使用专有的大型语言模型(LLMs)。经过过去两年的持续投资和发展,大型语言模型已成为科技公司的重要商品。Manus是一个例外,它基于Anthropic的Claude模型和阿里巴巴的Qwen模型构建,并试图通过更好的用户体验和产品演进来建立自己的壁垒。 ° llms是基础。代理的计划能力、推理质量、长上下文处理能力、工具使用准确性和多模态能力直接受到其底层模型的限制。 ° 中国的LLM在推理和代理基准测试中通过算法创新,从阿里巴巴、腾讯、字节跳动和Baidu等大型科技公司到DeepSeek、Zhipu、昆仑、MiniMax和Moonshot AI等较小的公司,都实现了全球顶尖的表现。更重要的是,中国的模型正变得越来越便宜,通过成本效益突破——最近几个月推出的大多数模型的价格仅为OpenAI/Google/Anthropic模型的约10%。(下一节的模型创新和价格。) •尽管在工具集成方面缺乏生态系统优势,初创公司擅长产品创新 ° 各大科技公司在其发布后推出了他们的代理产品,例如阿里巴巴的Quark(从搜索引擎升级并加入AI功能)于3月份推出,字节跳动的Coze和B站的新向于4月份推出。他们在生态系统中具有巨大优势(专有应用、云、用户流量和LLMs)。 ° 然而,在我们看来,面向消费者的AI代理更多是一个产品开发流程,例如工作流设计、工具操作、多模态集成、多代理协作和沙盒操作。从这个角度