AI智能总结
行业研究·行业专题 互联网·互联网Ⅱ 投资评级:优于大市(维持) 证券分析师:张伦可证券分析师:刘子谭0755-81982651liuzitan@guosen.com.cnzhanglunke@guosen.com.cnS0980525060001S0980521120004 摘要 •AI Agent是突破指令执行的智能实体,核心是具备代理权,可主动感知、自主决策并执行复杂任务,区别于LLM(知识输出)和传统自动化(规则执行)。在AGI分级中,Agent处于L3智能体阶段,性能等效90%熟练成年人。 •AI背景下AI Infra(AI基础设施)层面临重构,客户将重新选择云/AI平台,云厂加大布局AI/Agent平台瓜分新市场:微软聚焦B端基础设施,是市场上模型支持最全面的平台,工具链和生态整合全面,安全与稳定性强,云收入增速显著领先;谷歌依托AI Studio兼顾B/C端多场景,多模态强但生态不成熟、市占率较低;亚马逊依托AWS服务中小企业为主,侧重算力销售与便捷部署但工具链分散。国内字节扣子覆盖全场景,开发者与智能体数量领先;阿里百炼主攻B端全行业、服务30余万企业客户,MCP工具链和开源生态丰富。 •海外模型呈现差异化发展、国内模型层并未拉开显著差异,2025年初伴随深度推理与长上下文模型发布推动Tokens调用量快速提升,推理消耗仍以各家内部场景为主。根据Openrouter数据谷歌Gemini(长上下文+多模态)、Anthropic Claude(编程等严谨场景)占API市场半壁江山,国内DeepSeek、阿里Qwen系列份额稳步提升。谷歌2025年7月调用量980万亿(较去年增100倍),其中内部需求占比高达97%,AI推理需求已成为TPU发展的核心动力。国内字节豆包2025年5月日均Tokens 16.4万亿(增137倍),内部占比超80%。 •应用C端重磅搜索产品主要依赖模型能力与生态导流拉开差距,图像与编程类产品发展迅猛。我们判断应用越偏向垂类,则技术门槛越低、产品理解要求越高、竞争越激烈,商业化闭环越容易。硬件端短期以AI手机/PC为核心、长期向多终端无感交互演进。海外ChatGPT(MAU预计年底超10亿)、Gemini(MAU 4.5亿)领先,国内夸克、元宝依托生态导流。图像类Midjourney(ARR 5亿美元)、可灵(月收入1.5亿元),编程类Cursor(ARR 5亿美元)、GitHub Copilot(Web MAU1.2亿)表现突出。 •应用B端Copilot/Agent产品形态丰富、持续渗透,机遇与挑战并存。目前微软Copilot家族月活用户已超1亿,成为B端Agent/Copilot代表性产品,但企业落地仍面临幻觉、数据安全、成本高(Agent调用成本为LLM 15倍)等问题,B端SaaS面临技术革命下(软件制作成本逐步趋近于零)的产业范式重构。从行业来看酒店/餐饮/旅游行业GenAI投入最高。 •Agent市场规模与发展预测:根据IDC数据,全球AI IT支出2023-2028年CAGR 22.3%、其中GenAI达73.5%。CBINSIGHTS预计2032年AIAgent营收有望达1036亿美元(CAGR 44.9%)。根据Garnter与IDC,短期(2023-2025)GenAI嵌入现有应用,中期(2025-2027)Agent成核心组件,长期(2027+)自主代理网络主导业务,2035年后Agent将成为认知共生的人类助手、智能体即应用将成主流。 Ø投资建议:伴随模型能力提升、AI Infra(AI基础设施)需求快速增长,推荐AI云平台厂商:微软(MSFT.O)、谷歌(GOOG.O)、亚马逊(AMZN.O)、阿里巴巴(9988.HK)、腾讯控股(0700.HK),AI芯片厂商英伟达(NVDA.O)与AI Data Infra数据服务厂商。 请务必阅读正文之后的免责声明及其项下所有内容Ø风险提示:宏观经济波动风险、AI技术进展不及预期风险、行业竞争加剧风险、AI幻觉问题影响等。 目录 Agent定义、技术与发展01Agent开发平台的布局02模型层与Tokens调用量分析03C端与B端Agent进展04Agent的市场空间与发展预期04 AI Agent:重塑企业智能的核心引擎 •定义:具备自主性、规划力与执行力的智能实体,超越“指令执行”进入“代理权”时代。核心突破在于赋予“代理权”(Agency)→主动感知环境、自主规划决策、执行复杂任务。 •关键特性:1)自主决策:主动感知环境、制定目标并采取行动;2)动态学习:通过记忆与经验积累实现持续优化;3)跨系统协作:调用工具、API及多Agent协同完成复杂任务。 •核心模块:1)感知层:多模态输入(文本/语音/图像);2)记忆层:短期记忆(对话上下文)+长期记忆(知识库);3)决策层:基于目标规划与强化学习的行动策略;4)执行层:工具调用(API)、跨系统协作(RAG技术)。 •关键区别:1)LLM≠Agent:LLM是“知识顾问”,Agent是“战略指挥官”;2)传统自动化:仅规则执行vs Agent:端到端任务闭环。 资料来源:Bang Liu,《Advances and Challenges inFoundation Agents》,arXiv:2504.01990,国信证券经济研究所整理 资料来源:Bang Liu,《Advances and Challenges in Foundation Agents》,arXiv:2504.01990,国信证券经济研究所整理 AGI的分级:Agent处于L3智能体阶段 •AI正站在一个关键新阶段。参考OpenAI对AI的五级分级,AI已不仅仅是能进行对话的聊天机器人(L1),而是逐步进化到智能体(L3)阶段:一个能思考、并能主动采取行动的AI系统。 •代理核心构成: ①记忆(Memory):存储、组织和检索短期上下文信息和长期知识的系统,支持自我反思优化。②感知(Perception):多模态环境识别(视觉/听觉/传感器)。③规划(Planning):LLM驱动的目标分解与行动序列生成,复杂推理和决策,将任务分解为步骤,并根据需要进行调整。④工具使用(ToolUsage):调用API/代码/搜索等扩展能力,与外部应用程序、API、数据库和其他软件交互的集成功能。 Agent相关技术创新:MCP与A2A •MCP(Model Context Protocol模型上下文协议)- AI的“万用接口”,标准化AI模型(LLM)与外部数据源、工具间的交互方式ØAnthropic在2024年11月推出并开源MCP协议,支持并行工具调用(如Web搜索、代码执行)和动态工作流编排。核心组件: ③MCP Host:承载AI模型的应用,如Claude Desktop和Cursor这类智能助手应用和IDE。 •A2A(Agent-to-Agent):让不同厂商或框架的AI代理彼此直接通信、协同 Ø2025年4月Google推出的开放协议,得到了Salesforce、SAP等50多家科技公司的支持参与。基于其设定的Agent Card、Task、Message等概念和相关认证策略,如“智能体卡”概念用于描述智能体的身份、功能和服务接口。 AI Agent市场图谱 ①基础设施类Agent:聚焦底层支撑,涵盖开发平台、多代理协同、数据策管等多环节,为AI应用构建基础。②横向职能类Agent:服务B/C端客户,从生产力工具到客服、人力等,跨行业适配,优化流程提效、助力日常运营。③垂直应用类Agent:深耕金融、医疗等特定行业,贴合行业流程、法规与需求,深度融合专业知识,形成行业专属解决方案。 垂直应用 AI Agent发展:增长迅猛,客户服务、软件开发占比较高 •头部细分市场:根据CBINSIGHTS企业工作流、编码两大领域2024年营收均超10亿美元,前者覆盖通用生产力、研究等场景,后者因AI编码工具爆发,半年内催生独角兽,速度达AI行业平均4倍。 •核心驱动与玩家:2024年科技巨头主导营收,微软MicrosoftCopilot(2024年收入约8亿美元)、GitHubCopilot(2024年收入约6亿美元),总占整体市场超25%份额。初创企业增长迅猛,如Cursor年ARR从100万升至2亿美元。 •垂类市场:调查主要针对企业端,客户服务、软件开发为高潜力赛道,24年底调查显示,64家组织中2/3计划12个月内用AI代理支持客服。垂类AI Agent覆盖企业通用场景(人力、营销、安全运营等),较基础设施、垂直赛道商业落地更成熟。 国内AI Agent生态:阿里、腾讯、字节、百度、快手、小米、美图、金蝶 海外AI Agent生态:微软、谷歌、OpenAI、META、亚马逊、Anthropic 目录 Agent定义、技术与发展01 02 模型层与Tokens调用量分析03 C端与B端Agent进展04 Agent的市场空间与发展预期04 Agent平台典型架构与核心环节 图:Agent开发平台架构Agent是GenAI从“概念验证”迈向“企业级应用”的关键桥梁,其核心在于通过流程重构与数据整合释放AI的规模化价值。 •数据管理与处理:数据采集,从内部系统、外部API、用户交互中收集数据。数据清洗、标注、特征提取、知识库管理。数据补充,外部与合成数据填补数据缺口。 •智能体管理:Agent生命周期管理,创建、初始化、启动、销毁Agent实例,支持批量部署与版本控制。实时跟踪Agent运行状态(如资源占用、任务进度),提供监控面板。多Agent协作管理,协调分工交互。 •算力资源:提供CPU、GPU、TPU等计算资源,支撑Agent的模型推理、训练及数据处理(如分布式计算集群)。 •开发者工具:如低代码开发平台工具,调试工具支持Agent对话流程调试、模型输出可视化。SDK/API文档提供标准化接口,方便开发者集成Agent能力。 •存储系统:结构化/非结构化数据存储(数据库)与缓存,存储Agent配置、用户信息、日志等。 •安全与风控:管理用户、Agent、外部系统的访问权限。加密存储敏感数据、控制数据传输加密。风险防控检测异常请求(如恶意攻击、高频调用),防止模型被滥用(如提示词注入防护)。 •运维与监控:日志系统收集全链路日志(请求、处理、错误),支持检索与分析。告警机制设置阈值(如响应超时、错误率)。监控资源瓶颈(CPU、内存、网络),自动扩缩容或优化资源分配。 •感知决策与交互:利用CV、NLP技术对各类输入感知处理并理解,提供各类大模型作为Agent决策推理的基础,利用API接口执行操作或输出生成。 •网络与通信层:API网关用于统一管理外部系统与Agent的接口调用,消息队列支持Agent间、Agent与外部系统的通信,以及MCP、A2A等各类协议适配。 •插件市场与标准适配层:通过标准化接口、可插拔组件支持开发者根据需求自定义功能、集成外部资源,允许开发者开发“功能插件”(如特定领域插件、自定义工具调用),供用户按需安装。•外部协同与开发者生态:通过工具链、合作机制、共享资源等吸引第三方参与者(开发者、企业、服务商),形成“平台-开发者-用户”的协同生态。整合外部成熟服务(如支付接口、地图服务、OCR识别),形成行业解决方案模板库,建立社区与知识共享平台。 请务必阅读正文之后的免责声明及其项下所有内容资料来源:各公司官网,Bang Liu,《Advances and Challenges in Foundation Agents》,arXiv:2504.01990,国信证券经济研究所整理,国信证券经济研究所整理 Agent平台重要性:AI Agents由90%的软件工程和10%的AI组成 •冰山上端如Perplexity、Cursor等知名的AI Agent产