AI存算加速成为大模型竞争升级的关键 glmszqdatemark2026年03月29日 推荐 维持评级 市场回顾 本周(03.23-03.27)沪深300指数下跌1.41%,中小板指数下跌0.61%,创业板指数下跌1.68%,计算机(中信)板块下跌3.22%。板块个股涨幅前五名分别为:*ST汇科、渤海化学、天玑科技、优博讯、运达科技;跌幅前五名分别为:朗科科技、同有科技、GQY视讯、神州信息、浩云科技。 行业要闻 OpenAI永久关停Sora视频生成项目,战略转向AI代理国家统计局:我国Token调用量增长超千倍 分析师吕伟执业证书:S0590525110033邮箱:lvwei_yj@glms.com.cn 公司动态 汇金股份:3月27日,公司发布《关于筹划重大资产重组的进展公告》。披露重大资产重组进展公告:公司正筹划以现金方式收购库珀新能源20%股权,同时通过受让不少于31%表决权,实现对标的公司表决权比例不低于51%的控股,从而切入新能源储能领域。 研究助理白青瑞执业证书:S0590125110074邮箱:baiqingrui@glms.com.cn 投资建议 AI发展进入加速阶段,“打破内存墙”成为确定的技术趋势:1)在训练侧,CheckPoint可以保障模型训练的可持续性,却因低速存入造成算力闲置;2)在推理侧,影响计算效率的核心是访存,提高访存效率极为关键。全球持续探索“打破内存墙”技术路径,目前主要分为算法压缩、存内计算/存算一体、系统级互连与池化、以存换算等不同技术路径;伴随内存技术升级,AI训练端和推理端或迎来加速发展,推理端的快速成长有望进一步显著提升内存需求。 我们建议一方面聚焦存储产业链美光、海力士、闪迪、三星、铠侠等全球龙头,另一方面建议关注:信测标准(投资锋行致远布局AI存算加速)、星环科技(布局AI原生数据库)、澜起科技等布局AI原生存算加速体系的稀缺标的。 相关研究 1.计算机行业周报20260322:计算机行业2026年一季度业绩前瞻-2026/03/222.计算机行业周报20260315:人手一“虾”时代:Tokens需求通胀主线确立-2026/03/153.计算机行业事件点评:“龙虾”系列研究之核心受益方向:云计算篇-2026/03/094.计算机行业周报20260308:特斯拉Optimus V3发布在即,重视具身智能产业链-2026/03/085.计算机行业事件点评:Token需求“通胀”:国产算力是双重受益的“大国重器”-2026/03/05 风险提示:人工智能政策不及预期,行业竞争加剧。 目录 1本周要点.................................................................................................................................................................31.1“打破内存墙”成为确定的技术趋势............................................................................................................................................31.2投资建议..............................................................................................................................................................................................62行业新闻.................................................................................................................................................................73公司新闻.................................................................................................................................................................84本周市场回顾...........................................................................................................................................................95风险提示..............................................................................................................................................................11插图目录..................................................................................................................................................................12表格目录..................................................................................................................................................................12 1本周要点 1.1“打破内存墙”成为确定的技术趋势 AI发展进入加速阶段,“打破内存墙”成为确定的技术趋势。据TrendForce,算力性能的增长远远超过内存带宽和数据传输能力时,大量处理时间会花在等待内存数据上,而不是执行计算;当系统性能受限于数据传输速度时,就会出现典型的“内存墙”问题。近年来,GPU等AI芯片的计算能力增长速度远超内存带宽和数据传输效率,AI芯片计算能力提升了3倍以上,而内存带宽仅增加了1.6倍,通信带宽增加了约1.4倍。因此,大多数计算受限于内存访问和通信效率。 资料来源:TrendForce,国联民生证券研究所 资料来源:TrendForce,国联民生证券研究所 在训练侧,CheckPoint可以保障模型训练的可持续性,却因低速存入造成算力闲置。据华为《AI-Native技术与实践白皮书》,大模型的参数数量呈指数级增长,导致模型大小急剧增加,模型参数量越大,CheckPoint文件越大,由于CheckPoint中除了包含模型参数权重信息,还包含优化器、配置等训练任务信息,膨胀系数一般按6倍计算。例如,GPT-4的参数数量为1.76万亿。若使用FP16格式存储模型参数,GPT-4模型参数约为3.52TB,在模型训练过程中,模型的CheckPoint大小是21.12TB。按1min完成CheckPoint保存,5min完成CheckPoint恢复,数据并行度DP为30,则对存储系统的写带宽需求352GBps/s,读带宽需求为2112GBps/s。总之,大模型CheckPoint检查点管理涉及繁重的存储和作业恢复时间开销,频繁的CheckPoint检查点保存,加上从最近可用的CheckPoint检查点快速恢复训练作业,成为一项巨大的挑战。 资料来源:华为《AI-Native技术与实践白皮书》,国联民生证券研究所 大模型训练AI集群故障概率高,故障影响大,故障发生后任务恢复耗时长,浪费大量AI算力和时间。据华为《AI-Native技术与实践白皮书》,检查点CheckPoint通过在给定时间定期保存完整模型状态的快照来帮助缓解训练的模型状态丢失问题。如果发生故障,可以使用之前保存的CheckPoint快照将模型重建到快照时的状态,以从该点恢复训练。但是,根据CheckPoint检查点保存频率,通常会导致几个小时的计算时间损失。此外,保存和恢复CheckPoint过程本身会产生大量开销,恢复时所有节点都需要并发读取CheckPoint千亿大模型TB级大小的CheckPoint文件保存和恢复通常会成为训练过程中的瓶颈,CheckPoint保存和恢复过程中会长时间中断训练任务,浪费大量算力和时间,考虑到大模型使用的GPU/NPU规模,以1万卡为例,故障损失将会是数万个卡的时间。 在推理侧,影响计算效率的核心是访存,提高访存效率极为关键。大模型的推理主要包括Prefill和Decode两个阶段,据中国电信官网,Prefill和Decode两者计算类型不同:Prefill为计算密集型,时延主要由算力决定;Decode为访存带宽密集型,时延主要由访存带宽决定。PD混合部署时,两者互相干扰:Prefill时,Decode等待;Decode时,Prefill时延增加,P/D时延不稳定,资源需求更大;中国电信天翼云携手昇腾围绕大EP与PD分离技术进行深度创新,将DeepSeek671B满血版大模型按专家维度切分到不同的NPU上,使得单卡权重占用内存比例大幅降低,权重加载耗时大幅减少,且可用于KV数据计算的内存显著增加,实现高并发、高吞吐、低时延的推理性能。 资料来源:国联民生证券研究所绘制 资料来源:中国电信,国联民生证券研究所 全球持续探索“打破内存墙”技术路径,目前主要分为算法压缩、存内计算/存算一体、系统级互连与池化、以存换算等不同技术路径。 1.2投资建议 AI发展进入加速阶段,“打破内存墙”成为确定的技术趋势:1)在训练侧,CheckPoint可以保障模型训练的可持续性,却因低速存入造成算力闲置;2)在推理侧,影响计算效率的核心是访存,提高访存效率极为关键。全球持续探索“打破内存墙”技术路径,目前主要分为算法压缩、存内计算/存算一体、系统级互连与池化、以存换算等不同技术路径;伴随内存技术升级,AI训练端和推理端或迎来加速发展,推理端的快速成长有望进一步显著提升内存需求。 我们建议一方面聚焦存储产业链美光、海力士、闪迪、三星、铠侠等全球龙头,另一方面建议关注:信测标准(投资锋行致远布局AI存算加速)、星环科技(布局AI原生数据库)、澜起科技等布局AI原生存算加速体系的稀缺标的。 2行业新闻 OpenAI永久关停Sora视频生成项目,战略转向AI代理 当地时间3月24日,OpenAI于当地时间3月24日正式宣布,将关闭其曾经风靡一时的Sora视频生成应用,同时终止了其与迪士尼之间价值10亿美元的里程碑式合作协议。Sora的iOS应用程序、API接口服务以及Sora.com网站都将停止运营,具体时间表将在近期公布。媒体报道称,Sora研究团队将继续专注于世界模型的研究,以推进机器人技术的发展,帮助人们解决现实世界中的物理任务。 Anthropic诉美国防部胜诉,法院叫停AI禁用令 当地时间3月26日,美国加州北区联邦地区法院法官Rita F.Lin批准了Anthropic的临时禁令申请,阻止美国联邦政府禁用Anthropic人工智能技术的命令生效,“Anthropic目前不会受到限制,可继续履行其联邦合同”。该禁令为期一周,以便联邦政府有机会上诉。由于案件仍在审理中,该裁决并非最终决定。 中关村论坛AI主