您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:再次强调今年要重视国产超节点20260414 - 发现报告

再次强调今年要重视国产超节点20260414

2026-04-14 未知机构 SoftGreen
报告封面

2026年04月15日09:37 关键词 超节点推理训练低延迟光互联算力池化推理芯片PD分离LPU国产芯片950PR 950DT FP8大模型深度推理MOE架构算力芯片国产算力华为阿里云 全文摘要 今年,对国产超节点的重视显著增加,尤其强调了算力需求在推理和训练阶段的差异,其中推理阶段对低延迟的高要求成为焦点。超节点作为解决高速光互联、算力池化及推理芯片需求的核心方案,正被英伟达、华为、阿里和谷歌等科技巨头推广。国产算力芯片在支持超节点和新一代数据格式方面取得进展,如华为的950系列、寒武纪的690和海光的身份四号,预示着国产超节点落地元年的到来。 再次强调今年要重视国产超节点-20260414_导读 2026年04月15日09:37 关键词 超节点推理训练低延迟光互联算力池化推理芯片PD分离LPU国产芯片950PR 950DT FP8大模型深度推理MOE架构算力芯片国产算力华为阿里云 全文摘要 今年,对国产超节点的重视显著增加,尤其强调了算力需求在推理和训练阶段的差异,其中推理阶段对低延迟的高要求成为焦点。超节点作为解决高速光互联、算力池化及推理芯片需求的核心方案,正被英伟达、华为、阿里和谷歌等科技巨头推广。国产算力芯片在支持超节点和新一代数据格式方面取得进展,如华为的950系列、寒武纪的690和海光的身份四号,预示着国产超节点落地元年的到来。预计随着国产芯片的支持和优化,将大幅提升国产卡在大模型深度推理上的表现,为国产算力市场带来发展机遇。 章节速览 00:00超节点算力需求与推理时代特征探讨 对话围绕算力需求的转变展开,重点讨论了训练与推理对算力的不同需求,特别是推理时代的低延迟核心要求。介绍了推理算力的三个重要特征:高速光互联、算力池化、专用推理芯片,如华为的950 PD分离推理芯片。强调了这些技术进步对于提升数据处理速度和降低延迟的重要性,以及在实际应用中的表现。 04:33 PD分离与LPU:推理芯片的创新与应用 对话探讨了PD分离理念,即在推理过程中将preview阶段与decode阶段分离,以降低内存带宽需求,降低成本并提升速度。华为已率先实现这一理念,推出950PR芯片。此外,英伟达的LPU旨在加速首个token的生成,但无法替代高性能算力卡,两者在推理芯片中分工合作。高速光互联、算力池化及新兴推理芯片如PD分离与LPU,共同构成了拖地时代算力芯片的典型特征,超节点成为这些特征的综合表现形式,尤其适用于大模型的深度推理。 08:45超节点:大模型深度推理的核心表现形式 对话讨论了超节点作为大模型深度推理的关键表现形式,其优势在于能高效处理MOE架构下的专家模型,通过激活部分参数进行推理,从而降低成本、提升效率。超节点集高速度、光互联、算力池化和推理芯片于一体,满足推理算力需求,随着推理需求增长,超节点将更广泛应用于大模型推理领域。 12:12国产超节点芯片技术突破推动市场上涨 对话探讨了国产芯片在支持大模型深度推理方面的能力提升,特别是新推出的芯片如华为950系列、寒武纪690等,这些芯片支持超节点和新数据格式,标志着国产超节点落地的元年。由于去年的芯片不支持主流数据格式FP8,导致算力需求增加时股价未涨,而今年的新芯片解决了这一问题,提升了算力与Token消耗量的正相关性,预示着下半年国产超节点落地将加速。 15:59国产芯片与超节点技术推动算力市场发展 对话讨论了国产芯片在AI推理和训练领域的最新进展,特别是华为950系列芯片、华韩、武金、海光等公司推出的新一代国产芯片,以及阿里云的PPU芯片。这些芯片在性能上有了显著提升,能够更好地支持大模型的深度处 理。此外,还分析了产业链中的连接器和交换机芯片的市场预期及股价空间,强调了国产算力市场在推理时代的机遇,以及超级节点技术对算力提升的关键作用。 21:07国产算力卡助力大模型深度推理 对话强调了在推理时代,算力需求以低延迟为核心,高速光互联、算力石化及推理芯片成为关键特征,超节点作为主要落地形式,被看好用于大模型深度推理。国产算力卡,如华为950、海光深刻四号等,支持超节点及新一代数据格式,性能更优,预示着国产卡在大模型推理领域的广阔前景。 发言总结 发言人2 他,即西部证券的副所长、科技行业首席分析师郑宏达,在发言中主要讨论了算力需求在推理和训练阶段的不同,特别强调了推理时代对低延迟算力的迫切需求。他指出,为满足这一需求,行业正在发展三个关键特征:高速的光互联、算力池化和推理芯片。华为的950PR作为首款PD分离推理芯片已实现商业化,标志着国产算力芯片的重要进展。讨论还涉及了超节点的概念,强调其作为实现大模型深度推理的高效架构形式的重要性。他提到,今年是国产超级节点的落地元年,得益于新一代国产算力芯片的支持,这些芯片能够满足大模型推理的需求,预示着国产算力在推理时代将面临巨大机遇。整个发言涵盖了算力发展的最新趋势、技术特征以及国产算力芯片的市场前景,表达了对国产算力未来发展积极看好的态度。 发言人1 他首先强调了本次西部政宏达会议对国产超节点的重视,提醒参会者会议内容仅供西部证券研究客户参考,不构成投资建议,参会者需自行承担投资风险。同时,他指出专家发言不代表公司观点,强调会议内容需合法合规,以避免引发股价异常波动或影响市场稳定。此外,他强调未经授权不得复制、转载会议内容,否则将承担法律责任。最后,他对参会者表示感谢,并推荐使用AI工具和进门APP获取更多投研内容。 要点回顾 在算力方面,推理和训练对算力的需求有何不同? 发言人2:推理时代和训练时代对算力的需求是完全不一样的。训练对算力的需求是规模和稳定性,需要构建大规模集群(如一万卡甚至10万卡)并尽可能减少宕机次数以保证训练过程稳定。而推理时代的核心需求则是低延迟。 推理时代对算力有哪三个重要特征? 发言人2:推理时代对算力有三个重要特征:首先,高速的光互联技术被用于加快数据传输速度,实现低延迟;其次,算力池化,即将计算单元和存储单元做成池化,方便快速调取,从而降低延迟;最后,推出专门的推理芯片,如英伟达的LPU和华为的950系列,它们在推理过程中根据不同的阶段(preview阶段和decode阶段)需求,优化内存带宽使用,降低成本并提升速度。 什么是PD分离技术,以及它如何应用于推理芯片中?LPU在推理过程中的作用是什么? 发言人2:PD分离(Preview和Decode分离)是一种理念,由英伟达提出,主要针对推理过程中的两个阶段:打字输入阶段(preview阶段)和模型回答阶段(decode阶段)。在PD分离的推理芯片中,如华为的950系列,预览阶段只需较小的内存带宽,而解码阶段则需要高速内存带宽。通过将两个阶段分离,可以降低成本、提升速度,并非训练芯片所需,而是针对推理优化。LPU(由英伟达推出)是在算力卡上添加的小型存储模块,其主要目的是提高出第一个token(即AI模型回答的第一个字符)的速度。尽管LPU能显著降低第一个token的响应时间,但它并不能替换掉如HBM等大容量高速内存的使用,而是与之分工合作,共同完成推理过程。 超节点如何体现推理时代的算力需求特征? 发言人2:超节点是高速光互联、算力池化以及新兴推理芯片等特征的综合表现形式,尤其在应对推理任务时具有更好的性能表现。通过构建超节点,可以更好地利用这些特性进行深度推理,从而提高整体的推理效率和效果。 超级点是什么,它在大模型中扮演了什么角色?为什么使用超级节点对大模型进行推理更方便? 发言人2:超级点可以通俗理解为由几十甚至上百张卡组成的集群,例如谷歌的64卡timber集群就是一个超节点。现在包括英伟达、阿里、谷歌和华为在内的多家公司在研发自己的超级点,并预计今年超级节点将大规模普及推广。在大模型深度推理中,超级节点作为核心表现形式,由于大模型通常采用MOE架构(混合专家模型),将众多小模型放在超级节点内,方便激活部分小模型进行推理,从而提高效率和便捷性。大模型在深度推理时仅激活部分参数,而非全部。将这些被激活的小模型或expert分散放在不同的节点和服务器中,通过超级节点实现灵活激 活,读取并利用其他节点的存储和计算资源,这样就极大地简化了推理过程,提升了效率和成本效益。 国产新一代芯片与大模型消耗量之间有何关系? 发言人2:目前,国产新一代芯片如华为950系列、寒武纪690和海光身份四号等,均能实现与大模型深度推理同步增长,基本保持正比关系(考虑优化因素)。随着这些芯片对大模型深度推理的支持和算力的增强,国产超级点的落地将更快更多,这也解释了为什么相关国产芯片公司的股价开始上涨。 为什么今年被认为是国产超级点的元年? 发言人2:今年被视为国产超级点元年,是因为国产新一代算力芯片开始全面支持大模型深度推理,包括FP8数据格式,并且可以构建超节点。之前的老一代国产芯片在处理大模型深度推理方面效果一般,但今年推出的华为950系列、寒武纪690以及海光身份四号等新芯片,不仅支持超节点和FP8数据格式,算力能力也有所提升,因此今年成为国产超节点落地的元年。 华为产业链中连接器市场的竞争格局如何?华为产业链中还有哪些其他相关公司或产品? 发言人2:华为产业链中的连接器市场主要由华丰科技、英华股份和航天电器等公司占据主导地位。此外,华韩、武金、海光等也在做自己的超节点,并且可以为客户提供超级节点的交付服务。华为寒武纪和海光今年将推出新一代国产芯片,如690及深圳四号线,性能相比之前大幅提升。 市场对华为产业链上相关公司的估值策略是怎样的? 发言人2:市场通常会根据华为950系列或阿里PPU的出货量,结合产业链中所需连接器、交换机芯片的数量及利润,来计算整体出货量的比值,从而推算出股价空间。 对于盛科通信在华为产业链中的角色和市场空间怎么看待? 发言人2:盛科通信作为交换机芯片的重要组成部分,在阿里云超节点落地中起到关键作用。根据预测,阿里云今年PPU出货量至少在35万颗以上,而每4颗PPU对应大约1颗盛科通信的交换机芯片,这意味着盛科通信有较大的市场空间。明年PPU出货量预计将达到70万颗,进一步推高了盛科通信的股价空间。 对于寒武纪和海光这类已实现盈利的公司,市场如何看待它们的价值? 发言人2:对于寒武纪和海光这类已实现盈利的公司,市场更关注它们自身收入利润的预测,并基于此给出PE估值进行估值。 超节点在大模型深度推理中的地位是什么? :超节点是大模型深度推理的主要落地形式,能够通过高速光互联、算力、石化和推理芯片等三大特征实现低延迟、高效处理,满足规模化和稳定性的要求。 国产超节点落地的重要性和国产卡的发展前景如何? 发言人2:今年是国内国产超节点落地的关键一年,国产卡性能逐渐提升,能够更好地应对大模型深度推理的需求。随着推理时代的到来,国产卡支持超级点和新一代数据格式,更适合做大模型深度推理,因此看好国产算力的发展机会。