行业投资评级:强于大市|维持 孙业亮/刘聪颖中邮证券研究所计算机团队 中邮证券 发布时间:2026-06-16 投资要点 算力需求爆发式增长,全球竞争日益激烈:随着人工智能、大数据、工业互联网等数字化技术规模化应用,全球算力需求高速增长;据中国信通院数据,截至2024年底,全球通算规模达628EFlops,同比增加14.0%,智算规模达5693EFlops,同比增加64.7%;据IDC预测,2025年全球人工智能服务器市场规模为1587亿美元,2028年有望达到2227亿美元。 Token经济正在开展一场智能定价革命:根据全球最大AI模型API聚合平台OpenRouter最新数据显示,3月16日至22日,全球AI大模型总Token调用量为20.4万亿,仅中国就达7.359万亿,占全球的36%,Token是其关键的主角之一。与传统算力租赁模式不同,“Token工厂”交付的不是算力时间,而是经深度优化后产出的智能单位Token,这不仅是技术升级,更是商业模式与价值分配的重构。 投资建议:建议关注1)AI基础设施:海光信息、寒武纪、中科曙光、浪潮信息、禾盛新材、协创数据等;2)AIDC厂商:润泽科技、东阳光、光环新网、数据港、奥飞数据、大位科技、豫能控股、世纪互联等;3)算力租赁厂商:宏景科技、润建股份、东方国信、首都在线等;4)运营商与云计算:中国电信、中国移动、中国联通、网宿科技、彩讯股份、优刻得等。 风险提示:行业竞争加剧风险;下游应用需求不及预期风险;Token价格大幅波动风险等。 大模型驱动算力需求指数级增长 Token工厂重构算力商业模式 目录 产业链与相关上市公司 风险提示 大模型驱动算力需求指数级增长 大模型驱动算力需求指数级增长 AI高速发展推动各行业数智化转型,全球算力需求高速增长。大模型正呈现由训练主导向训练与推理并重,由中心集聚向分布协同演进,训练与推理环节对算力双重刚需,显著推动智能算力基础设施踏上快速发展轨道;此外,用户对智能算力服务的诉求也由获取底层资源转向获取任务能力、结果交付与普惠化服务。据中国信通院数据,截至2024年底,全球通算规模达628 EFlops,同比增加14.0%;智算规模达5693 EFlops,同比增加64.7%。 大模型驱动算力需求指数级增长 智能体带来AI应用革命,算力需求的重点正从训练侧逐步转向推理侧。智能体需要持续感知环境、反复调用工具、不断生成结果,并与用户进行多轮交互,以Open Claw为代表的各类智能体应用加速涌现,推动AI产业迈向“应用落地”与“规模化服务”新阶段。据IDC数据,中国企业活跃智能体数量将在2031年突破3.5亿规模,年复合增长率达到135%以上,这一增速将领先全球主要市场;同时,由于智能体任务执行密度的增长和任务复杂度的提升,也将带来智能体Token消耗年均超30倍的指数级跃升。 资料来源:IDC咨询公众号,中邮证券研究所 大模型驱动算力需求指数级增长 政策层面已明确路线图与时间表:国务院印发的《关于深入实施人工智能+行动的意见》提出,到2027年新一代智能终端、智能体等应用普及率超过70%,人工智能在公共治理中的作用明显增强,到2030年提升至90%以上;工信部等八部门联合印发的《“人工智能+制造”专项行动实施意见》,明确到2027年将推动3-5个通用大模型在制造业深度应用,培育1000个高水平工业智能体,打造100个工业领域高质量数据集,推广500个典型应用场景,培育2-3家具有全球影响力的生态主导型企业和一批专精特新中小企业;地方政府同步跟进部署,面向制造业、金融、政务、医疗等重点领域,加快智能体产业布局。 资料来源:工信部官网,中邮证券研究所 请参阅附注免责声明 大模型驱动算力需求指数级增长 海外AI资本开支快速增长:微软、谷歌等美国科技巨头纷纷加大资本开支,特别是在GPU采购、数据中心、电力上的投入,大模型训练成本极高,导致只有头部云服务商和AI公司能负担,早期积累的模型质量、用户数据和算力规模会形成“马太效应”,谁在大模型和应用生态中占领先机,就会获得巨大战略优势。 中国正快速实现追赶:腾讯表示,今年下半年AI相关的资本支出会进一步增加;阿里表示,未来AI基建相关投入资金会远远超过3800亿;字节计划2026年资本支出将超过2000亿元人民币,较此前的初步计划增加了25%。 大模型驱动算力需求指数级增长 Token消耗快速增长:Token(词元)是连接技术供给与商业需求的“结算单位”,到2026年3月,我国日均Token调用量已超过140万亿,较2024年初增长了1000多倍,标志着AI发展已进入以推理和应用为核心的快速增长阶段;智能时代Token成为核心生产要素,伴随着智能体应用爆发,其需求呈指数级增长,预计2030年中国日均消耗Token量将达万万亿级,AI基础设施变得愈加重要。据IDC预测,2026年中国MaaS市场的Token消耗量将达到约4万万亿次,营收规模约186亿元,2024-2030年的年复合增长率约为1154.9%。 Token工厂重构算力商业模式 Token工厂重构算力商业模式 “Token工厂”重塑价值产出:作为大模型处理信息的最小单元,Token具备可计量、可定价、可交易的特性,既是AI服务的基本结算单元,也正成为数字经济的核心“能源”,“Token工厂”是高效连接起算力、模型与应用的枢纽;与传统算力租赁模式不同,“Token工厂”交付的不是算力时间,而是经深度优化后产出的智能单位Token,这不仅是技术升级,更是商业模式与价值分配的重构。未来智算中心竞争不只是芯片之争,更是软件、网络、能源、运营和生态的综合竞争。Token工厂正在把数据中心从基础设施行业推向制造业,而制造业的核心从来不是规模,而是效率。 Token工厂重构算力商业模式 Token的经济成本可拆解为资本性开支和运营性开支两部分:训练阶段以CAPEX主导,是一次性的重资本密集投入;推理阶段以OPEX主导,是随Token规模扩张的持续性边际成本。 训练阶段CAPEX主导固定成本:训练一个千亿参数级别的通用大模型,全流程需驱动数万张高端GPU连续运转数月,总成本约1-5亿美元;成本结构中,硬件折旧与高端研发人力薪酬合计占比超95%,电力消耗不足5%;单位Token摊销额随Token总产出增加而持续递减,构成Token规模经济的根本来源。 推理阶段OPEX主导边际成本:AI大模型一旦部署,每产生新Token,都需消耗固定的算力与电力,形成与Token调用量高度正相关的可变成本,其中电力成本通常占到OPEX总额的60%-70%,是最大单项开支,电力作为Token推理阶段主体边际成本的地位凸显。 Token工厂重构算力商业模式 Token的定价锚逐渐从GPU→能源→人才方向转移:Token的生产成本由芯片、电力、数据与人才四大要素构成,在不同阶段,决定Token价格底线的关键要素并不相同,定价权会沿着技术演进的节奏在四大要素之间逐步让渡。 当前阶段芯片是主锚:高端GPU供不应求,芯片的可获取性直接决定了Token的供给量与价格; 中期来看电力将成为硬性约束:电力受物理定律限制,随着AI数据中心能耗激增,能源成本将成为不可压缩的底线; 长期来看人才与知识密度将主导定价:大模型能力越强、在高端场景中为用户带来的边际收益越高,Token的溢价空间就越大。 Token工厂重构算力商业模式 海外三巨头OpenAI、Google、Anthropic均采用“输入/输出双轨Token计费”,核心依靠产品分层与生态协同盈利。 OpenAI用分层价格锁定全层级客户,依靠生态壁垒竞争:GPT系列采用阶梯化价值定价,高端推理模型保持高溢价,轻量微型模型小幅让利吸引开发者;其中,旗舰GPT-5.5每百万输入Token 5美元、输出30美元,面向企业复杂智能体、长周期推理任务,赚取核心利润;GPT-4o mini轻量化模型大幅下放价格,用于吸纳C端应用、小型开发者,构建全球最大开发者生态;收入结构不单一依赖Token计费,还叠加ChatGPT订阅、企业席位、智能体会话时长、文件存储等增值服务。 Google进行云生态捆绑,将Token作为GCP的导流工具:Google不单独售卖大模型API,而是将Gemini全套Token能力与GoogleCloud深度打包,Token定价拥有全行业最宽价格区间,从Flash-Lite超低价版本到3.1 Pro高端模型全覆盖;低价轻量模型补贴云业务,高端推理算力绑定政企云订单,依托搜索增强、多模态原生能力,把Token消耗转化为云存储、算力集群、容器服务增值收入;Token是云计算的增值配套,AI业务目标是拉动GCP整体市占提升。 Anthropic坚持品质定价:依靠超长上下文、企业级数据安全、合规能力建立品牌溢价;其中,主力Sonnet 4.6每百万输入3美元、输出15美元,旗舰Opus 4.6则定价翻倍,瞄准金融、法律、政务高敏感企业客户,不比拼调用总量,只为对数据安全、推理精度有刚性需求的企业提供服务,天然避开同质化低价竞争;此外还推出智能体会话按时长计费、分层缓存定价,跳出单纯按Token收费的单一模式。 Token工厂重构算力商业模式 随着MaaS与Token成为行业共识,头部厂商悉数重兵入场,竞争焦点也从规模化消耗Token,转向高质量、高效率、高价值消耗Token。 阿里Token Foundry:今年3月阿里已推出Alibaba Token Hub事业群,搭建“创造-分发-应用”词元基础框架;时隔三月升级为Token Foundry事业部,定位完成全面跃迁,不再单纯标准化输出通用词元,而是根据电商、零售、本地生活、企业办公等不同场景,定制推理链路、优化词元结构、搭建专属Agent词元工作流;同样一组词元,在通用对话仅产生流量,在阿里本地生活智能体可完成商家运营、订单调度、用户服务全流程,直接带来营收增量,以此重构词元定价逻辑,对冲行业低价内卷带来的毛利压力。 字节:一方面,Seed团队持续攻坚技术极限,打造视频生成、图像创作、代码编程、文本理解等全领域SOTA标杆模型,不断刷新模型能力上限;另一方面,火山引擎也将技术能力加速工具化、产品化,高效推向市场;Token价格必须与模型能力、产出价值绑定,即使单Token理论成本可能更高,但创造的经济价值要同步提升,要提升Token能力,并确保定价优势。 华为数字能源Token Factory:与阿里聚焦上层模型、场景应用的Token Foundry形成鲜明对照,华为数字能源从AIDC算力基础设施维度,定义产业底层的Token Factory;传统数据中心是存储数据的电子仓库,而新一代智算中心是工业化量产词元的专属工厂,电力作为生产原料,昇腾算力集群、液冷供电、储能系统作为生产设备,持续稳定输出标准化、可计量的推理词元;华为Token Factory不绑定单一厂商大模型,是中立的算力基础设施底座,无论阿里Token Foundry、华为云盘古大模型,还是第三方企业MaaS平台,均可接入华为AIDC词元工厂获取规模化算力供给。 腾讯:将原隶属于腾讯云的MaaS大模型服务平台升级为“TokenHub”,升级后的TokenHub支持通过API调用混元、DeepSeek、MiniMax等主流大模型,并提供Token Plan统一计费。 请参阅附注免责声明 Token工厂重构算力商业模式 五象云谷词元(Token)工厂:基础层,五象云谷智算中心总算力规划40000P,为Token生产提供坚实的算力底座;平台层,算力调度+模型优化+算法加速,三重技术协同发力,通过异构算卡细粒度虚拟化、队列抢占机制与自研算法加速引擎,大幅提升Token吞吐量,将单位生产成本极致压榨,降低Token单位成本;服务层,Token管理平台集成API接口