AI智能总结
海外科技巨头业绩超预期,持续加大AI基建支出。1)谷歌:2025年第一季度营收902.3亿美元,净利润345亿美元,均超预期。一季度谷歌云计算部门的收入同比增长28%达123亿美元。谷歌将维持今年2月公布的资本支出计划,即2025年全年资本支出达到750亿美元,用于建设数据中心等项目,较2024年的530亿美元显著增加。2)微软:截至3月31日的2025财年第三财季财报营收为700.66亿美元,同比增长13%;净利润为258.24亿美元,同比增长18%,在云计算业务Azure强劲增长加持下业绩超过分析师预期。其中智能云业务事业部营收为267.51亿美元,较上年同期的221.41亿美元增长21%。剔除财务租赁的资本支出达167.5亿美元,同比增长近53%。2026财年微软预计资本支出将继续增长,但增速将低于2025财年,届时将包括更多短周期资产支出。3)Meta:2025年第一季度营收为423.14亿美元,同比增长16%;净利润为166.44亿美元,同比增长35%。首席执行官扎克伯格表示目前Meta AI已拥有近10亿月度活跃用户。上调资本开支指引:Meta预计2025年全年资本支出将达到640亿至720亿美元,较此前预期的600亿至650亿美元有所增加。 Agent内在技术对算力天然存在高需求。以LLM为核心驱动的Agent技术展现出强大的智能交互与任务处理能力,其背后也蕴含庞大的算力需求。从内在技术维度深入剖析:1)Agent接入外部数据以及多次调用模型带来的长上下文。Agent工作时需要维持一个庞大的上下文信息,包括用户输入、系统提示、通过检索增强生成从外部数据源获取的补充信息。即使是看似简单的单轮对话,背后也可能涉及复杂的上下文处理和推理过程,对于需要多步规划、工具调用或持续交互的任务,模型推理次数会更多,进而消耗更多算力。2)Agent能力增强带来调用频率提升。随着Agent在自然语言理解、任务执行等多方面能力不断增强,其应用场景不断拓展,用户依赖度显著提高,阿里云平台大语言模型API调用量近一年增长近100倍便是有力佐证,高频次的模型推理大幅增加了算力需求。3)Agent执行任务验证带来算力开销,为确保任务执行的准确性、可靠性与合规性,如Manus的三重校验体系不可避免地消耗大量算力。4)多模态发展趋势下,Agent需处理整合文本、图像、音频等多种类型数据,且要满足实时性交互需求,进一步推高了算力消耗。这些内在技术因素共同作用,使得Agent对算力天然存在高需求。 Agent处于爆发期,应用层出不穷。Agent正处于技术高速迭代、应用场景不断拓展、用户数量激增的爆发期。1)市场规模看,亿欧智库预测,2024年中国AI Agent市场规模为1473亿元,企业渗透率不足5%,但到2028年规模有望飙升至3.3万亿元。2)在应用场景方面,通用AI助手如豆包、DeepSeek等迅速积累海量用户,成为新的流量入口,其中DeepSeek仅7天便实现1亿用户增长,到2025年2月中国生成式AI用户总数达2.5亿。垂直领域的Agent应用也蓬勃发展,例如营销领域,AIAgent覆盖客户交互、内容生产等全链路环节;在旅行领域飞猪“问一问”多智能体通过连接实时报价引擎,为用户提供定制化旅行服务。3)MCP模模型上下文议))的响力力不断大大,其作为开源议)准准化大模型上下文连( 接方式,加速了Agent生态构建;4)OpenAI的GPTs、字节跳动的Coze平台等智能体开发平台,以低代码甚至无代码开发模式降低开发门槛,推动Agent应用的创新与普及。5)除了用户端的推理需求,还是模型训练阶段对更大规模数据和模型参数量的需求也对算力提出了更高要求。 算力瓶颈响力Agent服务的用户体验。Agent的算力瓶颈问题日益突出,严重响力用户体验。1)随着用户量的爆发式增长、模型复杂度不断提升以及应用场景的日益多样化,服务力应延迟、不稳定甚至中断等问题频繁出现:以Manus为例,执行文字类任务需15-20分钟,复杂的网页交互任务耗时更长达31分钟;字节推出的扣子空间因备受关注,在开放demo后出现服务器拥堵现象。2)为保障用户体验,Agent服务提供商需预留应对用户流量波动的冗余算力,然而用户访问量受节假日、营销活动等多种因素响力具有不确定性,尽管部分平台如DeepSeek通过动态调整节点的方式,在白天高负荷时全力保障推理服务,夜间低负荷时用于研究和训练,但并非所有服务商都具备类似灵活调配能力,因此不可避免需要一定算力冗余。由此可见从模型训练到推理,从应对高并发到保障服务稳定性,算力已成为支撑Agent发展的关键基础设施和核心瓶颈。 建)关注: 算力:寒武纪、海光信息、阿里巴巴、奥飞数据、海南华铁、云赛智联、潍柴重机、科华数 据、大位科技、玉柴国际、弘信电子、议创数据、亿田智能、宏景科技、圣阳股份、润建股 份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策响 视、顺网科技、恒为科技、网宿科技、朗科科技等。 Agent:金山办公、泛微网络、金蝶国际、鼎捷数智、用友网络、宇信科技、京北方、中科金财、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。 垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等。 互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。 军工AI:能科科技、品高股份、普天科技、海格通信等。 风险提示:AI技术迭代不及预期风险、宏观经济风险、行业竞争加剧风险。 一、海外科技巨头财报超预期,持续加大AI基建支出 谷歌: 4月24日谷歌公布第一季度业绩报告,营收902.3亿美元,净利润345亿美元,均超预期。一季度谷歌云计算部门的收入同比增长28%达123亿美元。营业利润率为17.8%,较去年同期9.4%明显提高。 谷歌表示其在数据中心、芯片和其他AI基础设施上的投入在今年正持续大大,第一季度资本支出飙升至172亿美元,高于去年同期的120亿美元,也略高于市场预估的171亿美元。谷歌仍将维持今年2月公布的资本支出计划,即2025年全年资本支出达到750亿美元,用于建设数据中心等项目,较2024年的530亿美元显著增加。 微软: 5月1日腾讯科技报道,微软公布了截至3月31日2025财年第三财季财报,在云计算业务Azure强劲增长加持下业绩超过分析师预期。微软第三财季营收为700.66亿美元,同比增长13%;净利润为258.24亿美元,同比增长18%。 微软第三财季智能云业务事业部营收为267.51亿美元,较上年同期的221.41亿美元增长21%,按固定汇率计算同比增长22%。运营利润为110.95亿美元,高于上年同期的95.15亿美元。 微软仍在持续加码AI基础设施投资。微软第三财季资本支出增长52.9%至214亿美元,低于Visible Alpha所调查分析师平均预期的223.9亿美元。不过,微软长期资本支出占比已降至约50%。微软投资者关系副总裁乔纳森·尼尔森表示,这反映出公司支出重点正从数据中心建设等长期资产转向芯片等短期资产。第三财季剔除财务租赁的资本支出达167.5亿美元,同比增长近53%,超出Visible Alpha所调查分析师平均预期的163.7亿美元。微软预计2026财年资本支出将继续增长,但增速将低于2025财年,届时将包括更多短周期资产支出。 Meta: 当地时间4月30日消息,Meta发布了公司2025年第一季度财报,营收与净利润均超出市场预期。财报显示Meta当季营收为423.14亿美元,同比增长16%;净利润为166.44亿美元,同比增长35%。首席执行官扎克伯格表示目前Meta AI已拥有近10亿月度活跃用户。 Meta上调资本开支指引:Meta预计2025年全年资本支出将达到640亿至720亿美元,较此前预期的600亿至650亿美元有所增加。此次调整反映出Meta为支持人工智能计划而增加的数据中心投资,以及基础设施硬件预期成本的上升。 二、Agent内在技术对算力天然存在高需求 当前以大语言模型模LLM)为核心驱动的AI Agent技术正在快速发展中,展现出理解复杂指令、自主规划、调用工具并执行多步骤任务的强大能力。从简单的问答、文本生成,到复杂的市场分析、代码编写、差旅预订,Agent正逐渐渗透到我们工作和生活的方方面面。技术浪潮下不容忽视的现实是Agent对算力的需求极其庞大,无论是训练更强大的Agent模型,还是支撑海量用户的高并发访问,亦或是确保Agent执行任务的准确可靠,都离不开底层算力的强力支撑。 图表1:智能体从对话交互到任务闭环进化 探讨Agent对算力需求巨大的几个核心原因,从技术层面上包括: 1、Agent需要处理长上下文和接入外部数据。 Agent的上下文窗口长度以及接入外部数据的能力直接关系到Agent能够处理任务的复杂度和深度,这种能力的提升直接关联到巨大的计算需求。计算需求增长对底层硬件模主要是GPU)提出了极高的要求,不仅需要更多的计算单元,还需要更大的显存来存储模型参数和中间计算结果。这是当前Agent技术发展面临的核心挑战之一,也是驱动算力基础设施不断升级的关键因素。 更长的上下文窗口意味着模型可以处理和记住更多的信息。IBM的解释中明确指出,模LLM)的上下文窗口模或上下文长度)是模型在任何时候可以考虑或“(记住”的文本量,以词元为单位。LLM的上下文窗口可被视为其工作记忆。它决定了LLM在不遗忘先前对话细节的情况下可以进行多长时间的对话。它还决定了一次可以处理的文档或代码样本的最大大小。当提示、对话、文档或代码库超过人工智能模型的上下文窗口时,必须对其进行截断或总结,模型才能继续处理。一般来说增加LLM的上下文窗口大小意味着更高的准确性、更少幻觉、更连贯的模型力应、更长的对话以及分析更长数据序列的能力提高。增加上下文长度通常需要增加算力要求,导致成本增加。 当用户与Agent进行多轮对话,或者要求Agent处理长文档、分析大量数据时,模型需要维持一个庞大的上下文信息。不仅仅是用户输入的文本,还可能包括系统提示、通过检索增强生成模RAG)从外部数据源获取的补充信息,如通过API调用、网页浏览、数据库查询等方式获取实时或特定领域信息。所有这些信息都需要在模型的工作记忆中占据空间。Agent执行这些外部调用本身就需要计算资源,而获取到的外部数据往往需要整合到当前的上下文中,再次增加了上下文的长度和处理的复杂度。例如一个Agent在规划旅行时,可能需要调用天气API、航班查询API、酒店预订API,并浏览相关旅游攻略网页。这些操作获取的信息都需要被模型理解和处理,以便生成最终的旅行计划。 这个过程涉及多次模型推理和数据整合,每一次都消耗算力。即使是看似简单的单轮对话,背后也可能涉及复杂的上下文处理和推理过程。而对于需要多步规划、工具调用或持续交互的任务,模型推理的次数会更多,进而消耗更多算力。 2、Agent能力增强带来的调用频率提升 随着Agent能力的不断增强,用户对其依赖性日益增加,调用频率也随之显著提升,这构成了算力需求的另一个重要驱动因素。 Agent能力的提升体现在多个方面:更强的自然语言理解和生成能力、更广泛的知识覆盖、更复杂的任务执行能力模如规划、推理、调用工具等),以及更流畅的多模态交互能力。Agent能力的提升将更广泛的应用场景和更高的用户采纳率。