AI智能总结
核心观点 ⚫无论后续中美关系走势如何,我国国产芯片替代趋势明确。海外大型基础设施建设如火如荼,英伟达芯片出货量持续上调,AI的大趋势无需质疑。近期,华为、海光、昆仑芯等多家国产AI芯片企业在技术和商业化落地方面取得突破,其产品在性能和性价比上进一步提升。我们认为,无论后续中美关系走势如何,国产芯片的替代趋势都是明确和持续的。 ⚫多家国产AI芯片性能和商业化落地进程亮眼,国产AI芯片加速追赶英伟达高端芯片。华为昇腾迭代规划亮眼,百度昆仑芯、阿里平头哥等产品性能及商业化落地表现出众、引起市场关注。2025年全联接大会上,华为公布未来三年昇腾芯片路线:2026年推950PR(自研低成本HBM)与950DT(144GB HBM),二者均支持多低精度格式、互联带宽2TB/s;2027年960规格翻倍且含自研4bit方案;2028年970在算力、互联/内存带宽上全面升级,直追英伟达Blackwell。而百度昆仑芯凭P800芯片拿下中国移动AI推理设备采购多标包高份额,在互联网、金融等领域皆有落地。另外,央视报道阿里平头哥PPU芯片显存、带宽超英伟达A800,拿下联通三江源智算中心大单。 浦俊懿执业证书编号:S0860514050004pujunyi@orientsec.com.cn021-63326320 宋鑫宇执业证书编号:S0860524090002songxinyu@orientsec.com.cn021-63326320 陈超执业证书编号:S0860521050002chenchao3@orientsec.com.cn021-63326320 ⚫超节点因能满足AI训推对集群低延迟、高带宽的需求,成为智算发展趋势,华为、沐曦、昆仑芯等国产厂商积极布局。华为在2025全联接大会发布Atlas 950/960SuperPoD超节点,分别支持8192/15488张昇腾卡、算力达8/30EFLOPS,还从协议与硬件双维度构建全链路高可靠互联体系。沐曦在世界人工智能大会推出光互连、耀龙3D Mesh等四种超节点形态。昆仑芯4月推出超节点产品,单柜容32/64张加速卡,卡间全互联带宽提8倍,显著提升MoE大模型训推性能。 投资建议与投资标的 我们认为,国产AI芯片频频取得突破,超节点规模持续提升。我国国产AI芯片和国产交换芯片性能持续提升,商业化进程持续推进。投资者们对我国AI算力发展的信心亦有望持续提升。 国产AI算力:相关标的寒武纪-U(688256,未评级)、海光信息(688041,买入)、华丰科技(688629,未评级)、南亚新材(688519,未评级)、中科曙光(603019,买入)、紫光股份(000938,未评级)、浪潮信息(000977,未评级)、神州数码(000034,未评级)、盛科通信-U(688702,未评级)、中兴通讯(000063,未评级) 风险提示 AI发展不及预期;行业竞争加剧。 目录 一、国产AI芯片密集取得突破,引起市场关注..............................................4 1.1华为昇腾一年一代,算力翻倍......................................................................................41.2昆仑芯性能和商业落地引起市场关注............................................................................41.3阿里平头哥亮相央视,关键性能参数超过A800...........................................................5 二、超节点成为智算发展趋势,华为、沐曦等国产厂商积极布局...................5 图表目录 图1:昇腾芯片迭代路线路...........................................................................................................4图2:平头哥PPU与英伟达A800、H20部分参数对比...............................................................5图3:超节点成为智算发展的重要方向之一..................................................................................5图4:Shanghai Cube国产高密度液冷整机柜..............................................................................6图5:昆仑芯超节点产品可容纳32/64张AI加速卡......................................................................6 一、国产AI芯片密集取得突破,引起市场关注 无论后续中美关系走势如何,我国国产芯片替代趋势明确。海外大型基础设施建设如火如荼,英伟达芯片出货量持续上调,AI的大趋势是无需质疑的。近期,华为、海光、昆仑芯等多家国产AI芯片企业在技术和商业化落地方面取得突破,其产品在性能和性价比上进一步提升。我们认为,无论后续中美关系走势如何,国产芯片的替代趋势都是明确和持续的。 1.1华为昇腾一年一代,算力翻倍 华为公布后续昇腾迭代计划,一年一代、算力翻倍。今年9月18日,华为举办了2025年全联接大会。华为公布了其自研AI芯片昇腾系列后续的迭代规划—“一年一代、算力翻倍”。在会上,华为宣布未来三年将推出昇腾950PR、昇腾950DT、昇腾960及970系列在内的多款AI芯片详细路标。昇腾950PR预计在2026年第一季度推出,昇腾950DT则计划于2026年第四季度发布。此外,计划在2027年第四季度推出昇腾960,2028年第四季度推出昇腾970。 昇腾自研HBM、互联带宽大幅提升,支持低精度算力,大幅提升运算效率。950PR主要面向Prefill和推荐场景的950PR,采用自研低成本HBM(HiBL1.0),可以降低推理成本。而950DT面向Decode和训练场景,使用HiZQ2.0HBM,内存容量达144GB。950两款芯片采用共Die设计,新增支持FP8/MXFP8/MXFP4等低精度格式,算力较上一代大幅提升,互联带宽达到2TB/s。互联带宽是之前我国AI芯片发展的瓶颈之一,今年出货的英伟达Blackwell系列芯片采用第五代NVLink,提供每个GPU 1.8TB/s的双向带宽。如今华为有望取得较大突破,直追英伟达。而将于2027年底发布的昇腾960各项规格较950翻倍,支持自研的HiF4格式是业界最优4bit精度方案。昇腾970支持FP4/FP8算力、互联带宽较昇腾960翻倍,内存访问带宽至少提升1.5倍,全面升级训练与推理性能。 1.2昆仑芯性能和商业落地引起市场关注 百度昆仑芯因其芯片优异的性能和广泛的商业应用获得市场关注。昆仑芯新一代芯片P800采用自研XPU-P架构,具有卓越的计算性能、完善的软件生态和领先的大规模部署能力,已实现实现万卡集群的成功部署。最近在中国移动2025年至2026年人工智能通用计算设备(推理型)集中采购项目里,基于昆仑芯的AI服务器产品在“类CUDA生态”的标包1、标包2和标包3中,分别拿下70%、70%、100%的份额,中标订单规模达十亿级,充分彰显了其产品在运营商领域 的竞争力。此外,昆仑芯也在互联网、科研、金融等领域实现规模部署,如中标招商银行AI芯片资源项目,围绕多个核心业务场景,全面助力招商银行落地大模型应用。 1.3阿里平头哥亮相央视,关键性能参数超过A800 平头哥PPU关键性能参数超过英伟达A800,拿下联通万卡大单。2018年9月,阿里巴巴集团的全资半导体芯片公司平头哥成立。平头哥拥有端云一体全栈产品系列,包括倚天710、镇岳510、含光800、羽阵600、羽阵611。近日,新闻联播报道的画面中出现了平头哥PPU芯片及英伟达A800和H20性能参数对比。其中平头哥PPU的性能参数超过A800:PPU采用96GBHBM2e显存,高于A800的80GB,片间带宽达700GB/s,远超A800的400GB/s,还支持更先进的PCIe 5.0接口。而在中国联通三江源绿电智算中心项目里,阿里云签约1024台设备、16384张平头哥算力卡,总算力1945P,成为该项目中最大订单。 二、超节点成为智算发展趋势,华为、沐曦等国产厂商积极布局 AI训练推理过程中对于集群低延迟、高带宽的需求持续提升,超节点成为发展方向,超节点规模持续提升。在9月18日的华为全联接大会2025上,华为发布了最新超节点产品Atlas 950SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡,算力分别达到8EFLOPS和30EFLOPS,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先。同时,为解决长距离连接与高可靠性难题,华为从协议架构与硬件设计双维度发力,构建了全链路高可靠互联体系。 图3:超节点成为智算发展的重要方向之一 沐曦、昆仑芯等国产芯片公司也推出多种超节点方案。在今年的世界人工智能大会上,沐曦推出四种超节点形态:包括光互连超节点(16-64x GPU)、耀龙3D Mesh超节点(32/64x GPU)、Shanghai Cube国产高密度液冷整机柜(128x GPU)等。今年4月,百度昆仑芯也推出超节点产品,单柜可容纳32/64张昆仑芯AI加速卡。单柜内卡间实现全互联通信,带宽提升高达8倍,实现对MoE大模型单节点训练性能5-10倍、单卡推理效率13倍的大幅提升。 数据来源:沐曦、华尔街见闻、东方证券研究所 风险提示 AI技术发展不及预期:若未来AI技术发展不及预期或AI发展不及预期,相关企业发展有不及预期风险。 行业竞争加剧风险:若AI算力行业竞争加剧,相关企业发展有不及预期风险。 分析师申明 每位负责撰写本研究报告全部或部分内容的研究分析师在此作以下声明: 分析师在本报告中对所提及的证券或发行人发表的任何建议和观点均准确地反映了其个人对该证券或发行人的看法和判断;分析师薪酬的任何组成部分无论是在过去、现在及将来,均与其在本研究报告中所表述的具体建议或观点无任何直接或间接的关系。据《 发 布证 券 研 投资评级和相关定义究 报 告暂 行 规 报告发布日后的12个月内行业或公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准(A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标普500指数);定 》 以 公司投资评级的量化标准 买入:相对强于市场基准指数收益率15%以上;增持:相对强于市场基准指数收益率5%~15%;中性:相对于市场基准指数收益率在-5%~+5%之间波动;减持:相对弱于市场基准指数收益率在-5%以下。 未评级——由于在报告发出之时该股票不在本公司研究覆盖范围内,分析师基于当时对该股票的研究状况,未给予投资评级相关信息。 暂停评级——根据监管制度及本公司相关规定,研究报告发布之时该投资对象可能与本公司存在潜在的利益冲突情形;亦或是研究报告发布当时该股票的价值和价格分析存在重大不确定性,缺乏足够的研究依据支持分析师给出明确投资评级;分析师在上述情况下暂停对该股票给予投资评级等信息,投资者需要注意在此报告发布之前曾给予该股票的投资评级、盈利预测及目标价格等信息不再有效。 行业投资评级的量化标准:相 关 上 看好:相对强于市场基准指数收益率5%以上; 中性:相对于市场基准指数收益率在-5%~+5%之间波动;