
本周观点 字节等头部大厂AI扩容,龙虾OpenClaw爆火带动Token消耗爆发。1)2026年3月3日,国内某数据中心服务商获得订单,将向字节跳动提供约500 MW(兆瓦)的容量,以发展豆包及其他AI技术,除字节外,国内头部互联网厂商均有算力投入加码举措。2)OpenClaw爆热带动Token消耗爆发,根据OpenRouter,OpenClaw当前为App & Agent流行度排名第一,截至目前累计Token消耗量达到8.52T。 训推共振,算力需求极速释放。我们判断,2026年将是中国算力需求从“云端训练”向“训练+推理”双轮驱动转型的关键之年,算力缺口将在更多模态和更广场景的催化下,极速释放。1)训练侧:向高质量与多模态进阶。头部互联网厂商(字节、阿里、腾讯)持续迭代万亿参数级模型,智谱、DeepSeek等新势力快速更新MoE架构。Scaling-law在多模态领域延续性显著,以Seedance为代表的模型对视频、音频及文本的统一理解,推动底层算力需求从单一文本向高消耗的视频/3D训练跃迁,对集群互联带宽与稳定性提出更高要求。2)推理侧:应用落地元年,需求斜率陡峭。2026年AI应用加速渗透,根据QuestMobile数据,豆包APP 2025年12月MAU已突破2.26亿,叠加春晚曝光效应,活跃度有望迈上新台阶;通义千问亦全面打通阿里生态。C端流量与AI漫剧、编程等原生场景爆发,叠加B端垂类模型蓄势,共同驱动实时推理算力消耗大幅增长。我们预测,推理侧需求将成为拉动产业链增长的新引擎。 供给端外部边际改善,内部国产化放量。我们认为,2026年国内算力供给端将从单一的紧缺状态转向结构性平衡,充沛的算力资源将有效承接需求端的爆发,为算力产业链的业绩兑现奠定基础。1)外部方面,根据相关贸易许可清单的更新,NVIDIA H200(合规版)已正式获批进入中国市场,短期内将有效缓解头部互联网厂商在超大规模模型训练上的算力焦虑,助推模型迭代速度。2)与此同时,国产算力芯片的性能与生态建设已跨过“可用”向“好用”的拐点。华为昇腾系列、寒武纪思元系列以及海光深算系列在实战中快速迭代;大厂自研芯片战略进入收获期,百度昆仑芯、阿里平头哥及字节跳动自研芯片均开始大规模部署;而摩尔线程、沐曦、天数智芯等初创厂商也在加速推进IPO进程,进一步丰富了市场供给。3)上游先进制程产能的扩充为芯片供应提供了底层保障。中芯国际刚刚发布的2025年全年财报显示,公司在先进制程及成熟制程的扩产上均取得突破性进展,全年产能利用率稳步回升,资本开支维持高位以确保新增产能的及时释放。 国产算力全链景气加速,有望量价齐升。在供需双侧强逻辑的挤压下,我们预判2026年算力产业链将进入“全链通胀”周期,行业景气度将从核心芯片向AIDC、云与算力服务、配套电力设备及服务器等环节全面外溢。投资策略上,鉴于字节跳动、阿里、腾讯等巨头较为明确的资本开支趋势,其供应链具有较高的业绩确定性,深度绑定头部互联网厂商(CSP)的供应链公司,或将获得显著的超额收益。相关标的 相关标的:东阳光、寒武纪、海光信息、润泽科技、豫能控股、协创数据、华丰科技、大位科技、利通电子、网宿科技、神州数码、云天励飞、润建股份、亿田智能、科华数据、中芯国际、华虹半导体、中科曙光、禾盛新材、奥飞数据、优刻得、首都在线、云赛智联、瑞晟智能、浪潮信息、潍柴重机、欧陆通等。 风险提示 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。 内容目录 一、字节等头部大厂AI扩容,龙虾OpenClaw爆火带动Token消耗爆发...............................31.1字节AI建设扩容,头部大厂算力投入加码..................................................31.2 AI界卷起“养龙虾”风暴,OpenClaw爆火带动Token消耗爆发..............................3二、训推共振,算力需求极速释放.................................................................42.1大模型“军备竞赛”并未降温,向更高质量、更多模态加速进步...............................42.2推理算力需求正以超预期的斜率上升.......................................................7三、供给端外部边际改善,内部国产化加速放量.....................................................9四、国产算力全链通胀,有望量价齐升............................................................10五、相关标的..................................................................................12风险提示......................................................................................12 图表目录 图表1:Seedance 2.0暂不支持真人人脸.........................................................3图表2:Seedance 2.0排队页面.................................................................3图表3:Seedance 2.0生成视频展示(1)........................................................5图表4:Seedance 2.0生成视频展示(2)........................................................5图表5:在各项评测中,Seedance 2.0的综合表现达到行业领先水平..................................5图表6:AI Arena模型盲测数据..................................................................6图表7:在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一......................6图表8:GLM-5 Coding能力及Agent能力取得开源SOTA...........................................7图表9:2025年累计抖音播放量TOP10漫剧统计,前十中AI漫及动态漫居多.........................8图表10:GPT‑5.3-Codex在SWE-Bench Pro上达到了顶尖(state-of-the-art)水平.......................8图表11:蚂蚁阿福“健康陪伴”功能.............................................................9图表12:国产通用GPU从“可用”向“好用”升级................................................9图表13:中芯国际产能/利用率持续提升..........................................................10图表14:腾讯云宣布全面适配主流国产芯片......................................................10图表15:智谱宣布GLMCoding Plan价格调整....................................................11图表16:2020-2028年中国智能算力规模及预测..................................................12 一、字节等头部大厂AI扩容,龙虾OpenClaw爆火带动Token消耗爆发 1.1字节AI建设扩容,头部大厂算力投入加码 字节再下500MW数据中心订单。据云头条公众号,2026年3月3日,《彭博社》报道,国内某数据中心服务商已获得一份创纪录的订单,将向字节跳动提供约500 MW(兆瓦)的容量。字节跳动希望获得更多的计算和存储容量,以发展豆包及其他AI技术。 Token消耗加剧,字节AI投入力度持续加大。字节跳动旗下火山引擎披露,截至2025年12月,豆包大模型日均Token调用量已经超过50万亿,半年内增长200%,比去年同期增长了10倍,在全球仅次于OpenAI和Google。Token的消耗大战,也让字节更激进地在算力和资本开支上布局。2025年12月23日,《金融时报》报道,字节计划在2026年豪掷1600亿元加码AI,其中一半预算将用于采购AI芯片。 多模态高并发,或击穿头部大厂算力储备。视频生成的底层逻辑基于DiT(DiffusionTransformer)架构,其对显存带宽(Memory Bandwidth)与并发计算量(FLOPs)的需求相比文本生成呈指数级跃升。字节跳动作为国内领先的大厂之一,依然在短期内面临供给熔断,这直观地验证了我们在年度策略中关于“2026年国内算力需求斜率高”的判断。这种“排队”现象揭示了一个产业现实:在向视频/3D等多模态演进的过程中,推理侧的算力缺口正从逻辑推演转化为实质性的产能短缺,且这种短缺将随着多模态应用的普及而常态化。 来源:江南都市报,国金证券研究所 来源:江南都市报,国金证券研究所 除字节外,国内头部互联网厂商均有算力投入加码举措。25年12月11日阿里巴巴26Q2财报业绩说明会上,公司管理层表示,针对之前公司提及的3年3800亿人民币资本开支,目前来看增加新服务器的速度已不足以跟上客户订单的增长,在这种情况下,如果目前的投资节奏不能特别好地满足所有客户需求,那么公司不排除进一步扩大该资本开支的可能性。 1.2AI界卷起“养龙虾”风暴,OpenClaw爆火带动Token消耗爆发 OpenClaw爆热,AI界卷起“养龙虾”风暴。AI Agent工具——OpenClaw在2026年初迅速走红,OpenClaw由奥地利连续创业者Peter Steinberger独立开发,能在本地设备上7×24小时自主执行任务,从被动对话工具转向主动执行代理,引发了个人AI助手革命的讨论。根据微信指数小程序,“养龙虾openclaw”关键词热度3月6日日环比增长1510.26%,近30日内热度陡峭增长。此外,OpenClaw成功于3月2日登顶GitHub平台榜首,超越了平台上所有的开源项目。 来源:微信指数小程序,国金证券研究所 来源:OpenClawX平台官方账号,国金证券研究所 龙虾OpenClaw爆火带动Token消耗爆发,验证国内算力斜率惊人。作为AI Agent应用,OpenClaw的高频自主调用机制使得推理Token消耗量较传统对话式AI呈现指数级跃升。根据OpenRouter,OpenClaw当前为App & Agent流行度排名第一,截至目前累计Token消耗量达到8.52T,Kimi、Minimax等国内大模型厂商,通过与OpenClaw实现生态合作,均由OpenClaw带来较高的Token消耗量。 来源:OpenRouter官网,国金证券研究所 来源:OpenRouter官网,国金证券研究所 二、训推共振,算力需求极速释放 2.1大模型“军