AI智能总结
Token需求“通胀”:从CPU到云服务 glmszqdatemark2026年01月24日 推荐 维持评级 市场回顾 本周(01.19-01.23)沪深300指数下跌0.62%,中小板指数上涨0.87%,创业板指数下跌0.34%,计算机(中信)板块下跌0.46%。板块个股涨幅前五名分别为:海联讯、金现代、卓易信息、久其软件、优刻得;跌幅前五名分别为:石基信息、*ST汇科、淳中科技、科大讯飞、格尔软件。 行业要闻 ➢美国商务部:放宽英伟达H200芯片对华出口限制,采用逐案审查机制。➢阿里千问:APP上线“任务助理”功能,AI智能体开始接管日常生活。 分析师吕伟执业证书:S0590525110033邮箱:lvwei_yj@glms.com.cn ➢公司动态 ➢汉邦高科:1月16日消息,公司披露发行股份购买资产并募集配套资金暨关联交易预案后的进展;公司拟发行股份向深圳高灯计算机科技有限公司购买安徽驿路微行科技有限公司51%股权,并向北京智耘贰零科技有限公司发行股份募集配套资金,本次交易预计构成重大资产重组及关联交易,不构成重组上市;截至公告披露日,以2025年8月31日为基准日的审计、评估工作已完成,重组报告书草案等文件基本制作完成,后续需中介机构完成程序性工作,公司将再次召开董事会审议相关事项并提请股东会审议,且需经深圳证券交易所审核通过及中国证监会注册后方可实施。 分析师郭新宇执业证书:S0590525110034邮箱:guoxinyu@glms.com.cn 研究助理白青瑞执业证书:S0590125110074邮箱:baiqingrui@glms.com.cn ➢投资建议 伴随Tokens需求快速提升,涨价趋势从上游逐步传导到CPU及云服务,全球云计算龙头AWS率先开启提价打破行业惯例,云计算及配套服务厂商有望迎来估值重构,建议关注 1)云计算:阿里巴巴、金山云、优刻得、深信服、宏景科技、首都在线、顺网科技、网宿科技、青云科技等; 2)CPU:海光信息、中国长城、龙芯中科、禾盛新材; 3)数据库:星环科技、达梦数据、海量数据、太极股份、超图软件,拓尔思等。 相关研究 风险提示:人工智能政策不及预期,行业竞争加剧。 1.计算机行业事件点评:再谈CPU产业链重大机遇-2026/01/212.计算机行业周报20260118:计算机行业2025年业绩前瞻-2026/01/183.计算机行业事件点评:2026:具身智能与机器人关键一年-2026/01/184.计算机行业事件点评:迎接AI+金融机遇-2026/01/145.计算机行业事件点评:重视“AI+数据”重要机遇-2026/01/13 目录 1 AWS涨价开启云计算全球涨价趋势..........................................................................................................................31.1云计算或是Tokens需求下一通胀方向.........................................................................................................................................31.2 CPU:AI Agent大趋势下,具有长期发展前景..........................................................................................................................41.3数据库:云计算产业链景气度提升的又一重要受益方向...........................................................................................................61.4投资建议..............................................................................................................................................................................................72行业新闻.................................................................................................................................................................83公司新闻.................................................................................................................................................................94本周市场回顾........................................................................................................................................................105风险提示..............................................................................................................................................................12插图目录..................................................................................................................................................................13表格目录..................................................................................................................................................................13 1AWS涨价开启云计算全球涨价趋势 1.1云计算或是Tokens需求下一通胀方向 2025Q4,AI产业链开启通胀传导,从存储到CPU后,云计算或为下一通胀方向。AI需求持续提升导致AI产业链自上而下出现不同环节依次涨价趋势,25H1开始存储率先开始涨价,26年1月CPU也开启涨价趋势,近期以AWS为代表的云计算厂商也开启涨价趋势。云计算厂商涨价或带来价值重估机遇,据维科网云计算观察微信公众号,AWS本次涨价标志着二十年来云服务价格只降不升的行业惯例被彻底打破,一旦云服务商在某一服务上成功提价而未引起大规模客户流失,第二次、第三次涨价就会变得更容易;AWS发言人解释说:“EC2机器学习容量块的定价基于供需模式而变化。此次价格调整反映了我们预期本季度的供需模式。” 云计算涨价有望带动系列配套产品涨价。据阿里云官网,一台云服务器ECS包括计算、存储、网络、快照服务等计费项及相关配套,都有望受益于云计算涨价趋势。 资料来源:阿里云官网,国联民生证券研究所 1.2CPU:AI Agent大趋势下,具有长期发展前景 AI算力快速发展趋势下,CPU作为基础设施,其需求与供给之间的矛盾或将延续,龙头在供给侧出现短缺。以CPU龙头英特尔为例,Intel 10和Intel 7的产能限制,限制了英特尔满足数据中心和客户端产品需求的能力。英特尔表示,由于需求持续超过供应,CPU短缺的情况可能会持续。针对2026年需求超过供应的前景,英特尔预计短缺将在2026年第一季度达到顶峰。英特尔不打算扩大这些节点的产能,这意味着随着需求的增长,产能限制仍将持续存在。 DeepSeek引领算力工程化优化,CPU重要性提升。MODEL1是DeepSeekFlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。结合近期DeepSeek发表的相关论文,对算力的工程化优化可能成为DeepSeek模型演进的一个重点,CPU的重要性有望大幅提升。 根据深科技官方公众号,在DeepSeek发表的论文《Conditional Memoryvia Scalable Lookup: A New Axis of Sparsity for Large Language Models》中,DeepSeek在实验中成功演示了将一个高达1000亿参数的Engram嵌入表完全存储在廉价的主机内存(CPU DRAM)中,而非昂贵的GPU显存里。在模型计算前序层级时,系统通过PCIe通道异步地将所需的记忆数据搬运至GPU。实验数据显示,即使在1000亿参数的超大规模下,这种跨硬件的存储与计算解耦方案带来的额外推理延迟也不到3%。这一工程结果表明,在特定的系统设计与实验条件下,模型参数规模不再严格受限于GPU显存容量。MoE的参数通常放在GPU显存(VRAM)里,因为计算需要极高的速度。但DeepSeek设计将这Engram的海量参数放在了性价比较高的CPU内存(RAM)里。 资料来源:英特尔商用官方公众号,国联民生证券研究所 对于CPU的数量、效能长期需求提升:CPU调用主存里的Engram表做哈希检索、筛选有效数据、异步传给GPU,比原来多了检索+数据转发负载的工作。实验显示“存算分离”的设计让推理速度仅下降了2%,实现了千亿级别的知识容量扩展。根据英特尔的测试结果,在同一款至强®6处理器平台上,如果使用AVX-512加速,在batch size等于50,token length等于14的FP16数据格式下,整个Engram的耗时需要10.046ms,而使用AMX来加速Linear转换计算和Conv卷积计算,Engram的耗时只要6.022ms,整体性能提升至AVX-512的1.67倍。 资料来源:英特尔商用官方公众号,国联民生证券研究所 AI Agent时代对CPU需求有望大幅增长。根据英特尔发布的《A CPU-Centric Perspective on Agentic AI》,Agentic AI框架在传统单体大语言模型 (LLMs)基础上,增加了嵌入外部工具(包括网页搜索、Python解释器、上下文数据库等)的决策协调器,将其从被动的文本应答工具转变为能够规划任务、调用工具、记忆历史步骤并动态适应的自主问题解决者。论文提出几个关键点:1)CPU上的工具处理会显著影响智能代理工作负载的执行延迟(占比最高达90.6%),这表明系统优化需要兼顾CPU与GPU,而非仅聚焦GPU。2)智能代理AI工作负载的吞吐量受限于两类因素:一类是CPU相关因素(核心超配、缓存一致性、同步机制),另一类是GPU相关因素(设备内存容量、带宽)。3)在大批量处理场景下,CPU动态能耗占比会变得显著(达44%),因为相较于GPU并行处理,CPU并行处理的能效更低。 AI Agent时代CPU可能比GPU更早成为瓶颈:在进行Agent相关的强化学习的时候,需要海量的CPU来构建各种工具和environment,CPU决定的