AI智能总结
2025年12月08日10:37 关键词 通用GPU华为寒武纪生态建设合作伙伴天数木兮摩尔A100 A800 H系列英伟达酷大金融NV switch国产化需求阿里平头哥超节点机柜服务器 全文摘要 国产GPU发展迅速,华为与寒武纪在生态系统建设上面临挑战,转而关注通用GPU领域。天数、沐曦等厂商在通用GPU技术上领先,预计下一代产品将与英伟达H系列竞争,展现出技术优势。尽管国产GPU在生态兼容性及避免英伟达限制方面有显著优势,但更新速度可能不及国际版本。 国产AI芯片超节点产业链以及行业格局演变- -20251207_导读 2025年12月08日10:37 关键词 通用GPU华为寒武纪生态建设合作伙伴天数木兮摩尔A100 A800 H系列英伟达酷大金融NV switch国产化需求阿里平头哥超节点机柜服务器 全文摘要 国产GPU发展迅速,华为与寒武纪在生态系统建设上面临挑战,转而关注通用GPU领域。天数、沐曦等厂商在通用GPU技术上领先,预计下一代产品将与英伟达H系列竞争,展现出技术优势。尽管国产GPU在生态兼容性及避免英伟达限制方面有显著优势,但更新速度可能不及国际版本。互联网大厂倾向于结合国产GPU与海外先进芯片进行模型训练。平头哥芯片在阿里巴巴内部广泛应用,展现了国产GPU在满足多样化需求上的潜力。超节点技术主要应用于大模型训练,国产GPU在推动国产化进程及满足互联网厂商需求方面扮演重要角色。 章节速览 00:00通用GPU生态与国产芯片适配挑战 对话探讨了通用GPU在生态建设中的优势,以及国产芯片适配的难点。华为等企业正转向通用GPU形态,与天数、木兮等厂商竞争。下一代产品将对标H系列,强调生态兼容性,避免英伟达限制。互联技术方面,各厂商采用不同方案,缺乏统一标准。 03:19通用GPU与ASIC在国产化趋势下的优势与挑战 讨论了通用GPU在生态兼容性上的优势及其在最新版本更新迭代上的劣势,指出ASIC在大模型未定型及快速发展的环境下适配难度较大。强调了互联网厂商因英伟达禁令而增加对国产GPU需求的趋势,如志杰和寒武纪成为主要供应商。腾讯和阿里分别通过投资和支持国产GPU,以及自研TPU,推动国产化进程。 06:49国产化算力与超节点技术发展探讨 对话围绕国产化算力在计算中心、信创领域如金融、运营商及能源行业的应用展开,强调了国产化需求推动资源部署。同时,对比分析了海光、5G、生成等公司在超节点方案上的差异,指出尽管对标英伟达NV272,国产超节点在性能上可能因工艺差异存在挑战,预计2026年左右实现大规模部署。 11:47算力需求与政府计算中心趋势分析 对话讨论了算力需求的行业变化,指出除了五大算力厂外,其他地区算力厂的发展态势对芯片厂商构成挑战。政府计算中心虽占重要地位,但占比呈下降趋势,行业正逐渐重视算力使用与行业应用的结合,强调闭环运营及服务行业的重要性。 14:49阿里平头哥芯片性能与市场应用分析 对话讨论了阿里平头哥芯片的性能、适配场景及市场应用。平头哥标称算力约100t flop 10,尽管算力不是特别高,但其在运营商项目中的兼容性和接受度良好。阿里集团内部及子公司采购芯片主要来自H20、H100等产品,近年逐渐增加平头哥的采购比例。平头哥芯片流片主要由台积电负责,未来规划中不排除中芯国际的可能性。平头哥依托阿里大平台,正积极拓展行业应用,特别是在安全、安防等领域展现出潜力。 19:38中兴交换机性能与国产芯片集群应用解析 讨论了中兴交换机在国内市场的优势,包括400G交换接口的支持,以及与华山、天数等国产芯片厂商的合作情况,指出中兴在交换机和自研网卡方面具有较强竞争力,尤其在大规模集群组网中应用广泛。 21:58 H200放开对国产算力市场的影响分析 讨论了H200放开对国内芯片厂商的影响,指出H200放开虽可能利好通用GPU赛道,但对国内厂商整体优势不大,且可能缩小国内市场份额。强调国内芯片技术追赶趋势,认为H200放开的接受度尚不确定。 25:05昆仑芯客户与出货量分析 对话主要讨论了昆仑芯的主要客户百度及其在运营商市场的份额,预计今年销量可达二三十亿,且明年出货量有望进一步增长。 27:10国产GPU厂商与海光BW系列性能及供应链竞争分析 对话讨论了国产新兴GPU厂商在CSP互联网客户领域的竞争力,对比海光BW系列,指出海光当前产品性能领先但下一代产品代际差可能导致优势减弱。供应链方面,厂商正通过争取台积电和中芯国际产能保障供应稳定性,尽管面临政策不确定性,但当前形势下仍有机会稳定获取7纳米制程。 32:13国内互联网大厂海外训练模型趋势 国内互联网大厂因获取不到先进训练卡,普遍在海外设立示范中心进行模型训练,再带回国内微调和推理,以减少训练时间。主要利用海外公开数据和现有业务数据,训练基础架构,而推理主要使用国内算力卡。未来随着超节点技术成熟,国内训练能力有望提升,但目前海外训练仍是趋势。 34:52 AI芯片性能对比:华为910C、海光BW1000与寒武纪590 当前,华为910C在性能上领先,其设计对标H100系列,而海光BW1000虽晚出但采用通用架构,通信性能更优。寒武纪590性能接近A100,但需等待下一代产品以提升竞争力。未来,随着IP8等高精度支持的加入,竞争格局预计在明年第二至第三季度发生重大变化。 37:09阿里芯片采购与平头哥供应情况讨论 对话讨论了阿里集团的芯片采购情况,包括采购寒武纪、华为等供应商的产品,以及平头哥芯片的外部供应量,但具体数据未公开。 38:19超节点在大模型训练中的应用 超节点主要应用于大规模模型训练,满足了高带宽、大规模数据传输和长时间训练的需求,尤其在大模型训练和微调场景下,超节点的需求迅速增长。华为等厂商推出的超节点方案,正被应用于政府和互联网企业的标杆项目及实际训练场景中。 41:01互联网大厂英伟达芯片采购现状及国产化趋势 互联网大厂如腾讯、字节、阿里等去年至今大量采购英伟达产品,特别是H20芯片,总数达数十万张。因无法获得英伟达先进产能,开始转向国产化测试,如PUC验证与ODM厂商合作,推动PD分离技术以提升性价比和降低成本。目前,国内厂商在H200无法获取的情况下,正加强计算能力,优化PD分离策略,以适应当前市场环境。 43:31天数之星芯片市场竞争力与生态成熟度分析 讨论了天数之星芯片的价格、下游用途及其相较于竞争对手的竞争力,强调了产品落地性、生态成熟度及算力部署优势。提及天干150与自凯系列的性能差异及市场接受度,展望下一代产品清单260与自卡200的性能提升。分析了int 8部署优势及大模型一体机合作案例,指出成熟度与出货量对央国企客户的重要性。 思维导图 发言总结 发言人3 他首先对专家的精彩解读表达了诚挚的感谢,并随即抛出了一系列有针对性的问题,旨在对超级点、数创公司、海光以及5G等领域的最新发展进行深入对比分析,特别强调了对生成的超级点技术的关注。此外,他表达了对各地区政治中心增量建设需求的浓厚兴趣,尤其是这些需求如何影响政府计算中心的行业落地方案。在技术趋势方 面,他特别提到了对华为AI芯片技术的动态、交换网络设计以及集群部署策略的深入了解渴望。 进一步地,他询问了天数之星主打芯片的价格策略及其市场竞争力,将此与木曦和摩尔等竞争对手进行了对比,同时也考虑到了时间因素对市场格局可能产生的影响。最后,他对所有参与者的贡献表达了感激之情,并预告了交流活动即将圆满结束,同时对各位领导的积极参与表示了衷心的感谢。 发言人1 讨论了中国国产GPU的发展情况,涵盖了华为、寒武纪、海光等厂商的技术进步与市场策略,以及GPU在云计算、AI训练和推理领域的广泛应用。他指出,虽然国内厂商在GPU技术上取得了一定进展,但高端市场仍面临与英伟达等国际巨头的竞争。他强调了自研GPU对于生态建设的重要性,并提到了超节点技术在支持大模型训练中的作用。他还分析了互联网企业对国产GPU的需求与倾向,并展望了未来市场和技术趋势,包括技术兼容性、网络协议以及芯片设计的先进性。此外,他还讨论了国内外市场环境对国产GPU发展的影响,以及国产GPU在金融、运营商、能源等下游领域的应用情况,强调了政府和互联网行业部署国产化算力的需求和趋势。 发言人5 他广泛询问了关于芯片和硬件设备的多个问题,主要包括对阿里平头哥芯片的性能评价、适配场景、代工情况以及外部采购芯片来源的讨论。他还询问了中兴交换机的性能、与国产芯片的配合情况及超节点中交换机的数量,探讨了H200芯片的开放可能性及对国产算力的影响,询问了昆仑芯的性能及其主要客户,以及今年和明年出货量的预测。此外,他还讨论了国内互联网大厂在海外使用先进芯片训练模型的情况,以及与寒武纪、华为、海光等厂商的性能对比,并询问了阿里使用的芯片总量、平头哥供应的外部芯片比例以及超节点的主要用途。最后,他还提到了互联网大厂手中剩余的英伟达芯片库存情况,并对参加电话会议的人员表达了感谢和美好祝愿。 发言人6 他关注了国产新兴通用GPU企业在云计算服务提供商(CSP)和互联网客户的市场表现,特别强调了与海光公司的对比分析。他表达了对这些企业在先进制程技术获取和商务谈判中所面临挑战的担忧,特别是如何确保与互联网企业合作的稳定性和后续的供应量可靠性,这直接影响到它们的商业拓展能力。同时,他确认了之前专家提到的信息,即即便未被列入特定名单的设计公司,仍能稳定获得台积电7纳米制程的生产,对此表示理解并感谢专家的回答。 发言人4 他提醒参会者,电话端用户在拨打电话提问时,应先按话机上的星号键,随后再拨数字1以进行提问。对于网络端用户,他指出可以通过直播间中的互动区以文字形式提问,或者点击举手按钮来申请语音提问的机会。最后,他表达了对所有参会者的感谢。 问答回顾 发言人1问:华为和寒武纪原本采用的CN生态在建设过程中遇到了哪些瓶颈点?国产通用GPU在生态建设方面的优势是什么? 发言人1答:华为和寒武纪原本依赖自家的CN生态,但在构建生态时对合作伙伴存在一些瓶颈点。为了适应通用GPU的发展趋势,华为也计划转向通用GPU形态。目前在通用GPU的第一梯队中,主要厂商如天数、摩尔等占据优势地位,单卡性能上,木兮的C500、天数的天丹150以及臂刃的BD产品与摩尔的S5000相比,后者性能相对较弱,主要对标的是A系列如A100和A800系列。国产通用GPU在生态建设层面具有得天独厚的优势,因为它在IPI层面实现了对英伟达技术的兼容,而底层实现则由自主可控的语句完成,因此不受英伟达针对特定产品的禁令限制。此外,国产通用GPU在互联方面支持多种协议,例如P3E switch和以太switch等,并且在未来下一代产品中也会继续支持多种互联方案。 发言人1问:国产通用GPU相较于英伟达产品有哪些劣势和优势? 发言人1答:国产通用GPU的优势在于其对主流框架如Python、TensorFlow等的良好兼容性,以及在大模型快速发展阶段能提供通用性基础。然而,在追赶最新英伟达扩大版本方面更新迭代速度较慢,存在一定的gap。对于特定应用如华为深思Mate 18和百度的Paddle等,国产GPU在性能上具有一定劣势,但通过底层基于Python框架所做的适配工作,可以大大缩短框架迁移成本。 发言人1问:互联网厂商对于国产GPU的需求变化是怎样的? 发言人1答:在英伟达对国内销售的部分限制下,互联网厂商对国产GPU的兴趣度提高。例如,字节跳动现在成为了国产GPU的重要采购对象,占据寒武纪90%至95%的产能;腾讯、阿里等互联网大厂也在研发和使用自家或投资的国产GPU,未来互联网领域将更倾向于采用国产GPU。 发言人1问:国产GPU在哪些下游领域有优势? 发言人1答:国产GPU的需求主要集中在计算中心领域,尤其是AI芯片公司和信创领域,如金融、运营商和能源行业等,这些领域由于有国产化需求,会倾向于部署国产化的算力资源。 发言人1问:在超节点方案方面