您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[财通证券]:H20解禁背后:国产算力加速进行时 - 发现报告

H20解禁背后:国产算力加速进行时

信息技术2025-07-28杨烨财通证券喵***
AI智能总结
查看更多
H20解禁背后:国产算力加速进行时

请阅读最后一页的重要声明!证券研究报告投资评级:看好(维持)最近12月市场表现分析师杨烨SAC证书编号:S0160522050001yangye01@ctsec.com相关报告1.《中美AI百花齐放,开启AI新时代》2025-07-202.《6月零售增势延续,小米汽车加速建设新工厂》2025-07-153.《RWA:链上资金与现实资产对接桥梁》2025-07-13-7%10%27%45%62%79%计算机 沪深300上证指数 ❖❖❖ 谨请参阅尾页重要声明及财通证券股票和行业评级标准内容目录1H20解禁,短期纾困与长期博弈的再平衡...................................................................31.1H20解禁:美方商业利益与战略妥协......................................................................31.2国产替代削弱封锁意义.........................................................................................42海外CapEx持续高增.............................................................................................93投资建议.............................................................................................................114风险提示.............................................................................................................12图表目录图1:RTX6000D...................................................................................................3图2:H20与RTX6000D性能对比............................................................................4图3:国产芯片与英伟达芯片对比...............................................................................5图4:CloudMatrix 384............................................................................................6图5:华为384超节点与英伟达GB200 NVL72性能对比...............................................7图6:华为384超节点与英伟达GB200 NVL72成本对比...............................................8图7:海外云厂商资本开支.......................................................................................10 2 谨请参阅尾页重要声明及财通证券股票和行业评级标准1H20解禁,短期纾困与长期博弈的再平衡1.1H20解禁:美方商业利益与战略妥协H20解禁,英伟达中国市场策略调整。2025年7月,英伟达CEO黄仁勋访华期间宣布美国政府已批准H20芯片恢复对华出口。H20芯片是英伟达按照美国对华技术出口管制要求,专为中国市场设计的AI芯片,其性能远低于国际市场主流GPU芯片H100。2025年4月该芯片被美国以国家安全为由,对包括中国在内的一些国家实施禁售。禁令实施后,英伟达因H20滞销面临45亿美元库存损失,并被迫计提55亿美元减值。我们认为,此次解禁是美国在权衡成本与收益后的策略调整。一方面,维持禁令对美国企业造成巨大损失,英伟达等企业在中国市场利益受损严重;另一方面,我国国产芯片的崛起使得继续封锁H20的意义降低,如华为新一代910C实测效率已超过英伟达H100水平。此外,美国科技巨头在AI基础设施上的领先优势未因H20出口而动摇,甲骨文、谷歌等已大规模采购、部署GB200。权衡之下,放松管制更符合美方当前利益。新的合规芯片RTX6000D推出。英伟达为保住中国市场份额,除推动H20解禁外,还宣布针对中国市场推出新的合规芯片RTX Pro 6000 Blackwell。此芯片专为我国制造业数字孪生需求设计,适配智能工厂、机器人仿真等场景。最早将于今年三季度启动供应,到年底的出货量目标是100-200万片。RTX 6000D采用最新Blackwell架构,台积电4N/4NP制程工艺,支持FP4精度运算,具备更高推理效率,搭载96GB GDDR7显存,定位于中低端AI市场,是一款由高性能消费级GPU演化而来的轻量化AI推理加速卡。尽管RTX6000D相较于H20在训练性能上有所不及,但其在单位算力能效、部署灵活性与成本结构方面具备明显优势,尤其适用于面向终端的推理服务和中小型AI企业的轻量级模型部署。英伟达通过将RTX6000D与H20形成产品矩阵 3 数据来源:英伟达官网,财通证券研究所 谨请参阅尾页重要声明及财通证券股票和行业评级标准4区隔——前者面向中小客户主打高性价比推理市场,后者服务于互联网大厂以大模型推理为主的重算力场景,构建了清晰的技术与客户定位互补策略,从而在中国AI市场构建起更宽广的产品覆盖面与客户接受度。我们认为,这一举措是其在商业利益与美国政策红线之间寻求“技术妥协”的表现。通过降低芯片性能至管制阈值以下,确保产品符合美国《出口管制条例》(EAR)要求,规避法律风险,同时保留在华商业通道。图2:H20与RTX6000D性能对比显存精度售价目标任务客户96GBHBM3FP161.2万-1.3万美元推理云厂商、超算中心96GB GDDR7FP46000-8000美元推理AI中小客户、边缘端1.2国产替代削弱封锁意义短期内,H20入华确实能填补部分推理算力缺口。H20与RTX 6000D的同步供应,将显著缓解国内AI企业的“算力饥渴”,推动区域性算力池扩容。尤其对互联网大厂,合规芯片的恢复供应可为其技术路线图续接关键窗口期;RTX 6000D则面向中小AI厂商提供极具性价比的芯片,多维度打开中国市场。此外,芯片禁令引发的供应链震荡余波未平,短期对AI产业链的直接冲击已导致大模型训练周期被迫延长,边缘计算等算力密集型领域的技术迭代节奏延缓,迫使企业转向“小模型集群化”等妥协方案以维系基础研发效能。从长远看,解禁或成为国产芯片产业升级“催化剂”。禁令倒逼下,国产芯片已实现从“可用”到“可采”的突破,但与国际领先水平仍有差距。H20将迫使国内企业更聚焦核心技术突破,而非满足于短期替代。此外,生态依赖性依旧存在。昇腾910C虽借CANN架构实现80% CUDA API兼容,但实测显示FP16精度任务仍存在15%-20%的性能折损,暴露出软件栈的深层短板;若企业因B30的多GPU扩展便利性(效率仅H20的75%)而延续对英伟达生态的依赖,将错失构建自主技术栈的黄金窗口。 谨请参阅尾页重要声明及财通证券股票和行业评级标准5黄仁勋称“昇腾384超节点性能上超越英伟达”。CloudMatrix 384由384张昇腾算力卡组成的超节点集群,单集群算力高达300PFlops,较英伟达NVL72的180PFlops高出67%,内存带宽达到后者的2.1倍,互联带宽提升至2.8Tbps,断点恢复时间缩短至10秒级。尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现了整体算力的显著跃升,并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。对此,黄仁勋曾公开表示,英伟达确实被华为超越,黄仁勋的认可是对华为“系统工程破局”路径的背书,证明单点落后不可怕,系统效能才是未来。对中国而言,昇腾证明在芯片制程落后一代下,可通过架构创新实现算力主权突围,为全球AI垄断撕开裂口。对全球来说,华为推动AI竞争进入集群规模超过单卡时代,其光互联、资源池化等技术或成未来超算新标准。 谨请参阅尾页重要声明及财通证券股票和行业评级标准数据来源:Semianalysis,财通证券研究所整理昇腾384超 节 点 的 整 体 计 算 能 力 是 英 伟 达GB200机 柜 的1.7倍 。据Semianalysis研究报告表明,CloudMatrix384通过5倍芯片数量堆叠,在系统 层 面 实 现 算 力 反 超 , 但 单 芯 片 性 能 仅 为 英 伟 达 的31%。 更 重 要的是 ,CloudMatrix 384深度契合中国产业优势,依托国产网络设备构建通信基础,通过自主基础设施软件保障系统可靠性,随着良率持续提升,未来可扩展至更大规模集群。这款产品也存在短板:其功耗达到GB200NVL72的4.1倍,每FLOP计算功耗高出2.5倍,每TB/s内存带宽功耗高1.9倍,每TB HBM显存容量功耗高出1.2倍,不过尚未构成实质性技术瓶颈。 6 谨请参阅尾页重要声明及财通证券股票和行业评级标准7昇腾384超节点成本较高。据Semianalysis研究报告表明,从成本来看,若采用单价低于200美元的400G LPO光模块(功耗约6.5W),Scale Up网络的总体拥有成本(TCO)约为NVL72机架的6倍,功耗更是超过10倍。即便按单GPU维度比较,CloudMatrix方案虽与NVL72成本相当,但功耗是其2倍,而理论算力是后者的30%。这种“以量补质”的集群化发展模式,正逐步成为国产算力产业破局突围的关键路径,为在制程工艺受限背景下实现技术追赶提供了有效解决方案。 谨请参阅尾页重要声明及财通证券股票和行业评级标准短期借势、长期自主。面对H20解禁,国产芯片的破局应聚焦三大方向:1.在“喘息期”内加大研发投入,攻克高端制程、先进封装等“卡脖子”环节,缩小与国际领先水平的性能差距。华为昇腾910B在推理算力上的自给自足已证明,技术突破是争取市场的基础。对我国而言,应警惕禁令的反复。同时,高端芯片供给绝不能寄望于外部限制的放松。在此次禁令解除带来的“喘息期”内,更应持续加大研发投入,着力构建更为完善的芯片产业链,集中攻克“卡脖子”环节,加速推进国产高端芯片的自主化替代进程;2.生态构建是必然趋势。我国需加速完善类似CANN的底层架构,提升对CUDA的兼容效率,降低性能损耗,同时推动MindSpore等国产框架与芯片深度协同,形成“芯片-框架-应用”的自主闭环。避免被“阉割版英伟达”再次以“合规+性价比”碾压;3.政府需通过持续研发补贴、应用场景开放等政策,为国产芯片提供“试错空间”。例如,石家庄市政府印发《石家庄市人工智能算力券实施方案(试行)》,启动人工智能算力券申领工作。石家庄市符合条件的中小企业可以申请获得不超过100万元的人工智能算力券支持。中小企业购买算力服务时,按费用50%补贴(上限100万元/年),重点支持新一代电子信息、生物医药等五大产业的大模型训练与应用。天津市数据局、市财政局联合印发了《天津市算力券实施方案(试行)》,采取10%灵活补贴+全流程服务,年度200万元补贴上限覆盖多轮测试成本,企业可连续验证国产芯片在超级计算、AI推理等场景的稳定性。 8 谨请参阅尾页重要声明及财通证券股票和行业评级标准2海外CapEx持续高增海外四大