行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

再次强调今年要重视国产超节点20260414

2026-04-14 未知机构 SoftGreen

核心观点与关键数据

算力需求转变：推理时代对算力的核心需求是低延迟，与训练时代对规模和稳定性的需求形成差异。
推理时代三大特征：高速光互联、算力池化、专用推理芯片（如PD分离、LPU）。
超节点技术：作为解决高速光互联、算力池化及推理芯片需求的核心方案，超节点是推理时代算力需求的关键表现形式，尤其适用于大模型深度推理。
国产芯片进展：华为950系列、寒武纪690、海光身份四号等国产芯片支持超节点和新一代数据格式（FP8），标志着国产超节点落地元年到来。
市场预期：国产芯片性能提升及对大模型深度推理的支持，将推动国产算力市场发展，相关公司股价上涨。

技术细节与市场格局

PD分离技术：将推理过程中的preview阶段与decode阶段分离，降低内存带宽需求，提升速度和效率。
LPU作用：加速首个token的生成，但无法替代高性能算力卡，与PD分离技术分工合作。
超节点构成：由数十甚至上百张卡组成的集群，通过激活部分参数进行推理，提高效率和便捷性。
华为产业链：连接器市场由华丰科技、英华股份等主导，华韩、武金、海光等公司也参与超节点研发。
市场估值策略：根据华为950系列或阿里PPU的出货量，结合产业链中所需连接器、交换机芯片的数量及利润，推算股价空间。
盛科通信市场空间：在阿里云超节点落地中起到关键作用，预计明年PPU出货量将达70万颗，推高盛科通信股价空间。
寒武纪和海光价值：市场关注其收入利润预测，并基于此给出PE估值。

研究结论

国产超节点落地元年：国产新一代算力芯片全面支持大模型深度推理，推动国产超节点落地加速。
国产算力卡前景广阔：国产卡性能提升，更适合做大模型深度推理，看好国产算力发展机遇。
超节点技术重要性：作为大模型深度推理的主要落地形式，超节点通过高速光互联、算力池化和推理芯片等特征实现低延迟、高效处理。

2026年04月15日09:37 关键词超节点推理训练低延迟光互联算力池化推理芯片PD分离LPU国产芯片950PR 950DT FP8大模型深度推理MOE架构算力芯片国产算力华为阿里云全文摘要今年，对国产超节点的重视显著增加，尤其强调了算力需求在推理和训练阶段的差异，其中推理阶段对低延迟的高要求成为焦点。超节点作为解决高速光互联、算力池化及推理芯片需求的核心方案，正被英伟达、华为、阿里和谷歌等科技巨头推广。国产算力芯片在支持超节点和新一代数据格式方面取得进展，如华为的950系列、寒武纪的690和海光的身份四号，预示着国产超节点落地元年的到来。再次强调今年要重视国产超节点-20260414_导读 2026年04月15日09:37 关键词超节点推理训练低延迟光互联算力池化推理芯片PD分离LPU国产芯片950PR 950DT FP8大模型深度推理MOE架构算力芯片国产算力华为阿里云全文摘要今年，对国产超节点的重视显著增加，尤其强调了算力需求在推理和训练阶段的差异，其中推理阶段对低延迟的高要求成为焦点。超节点作为解决高速光互联、算力池化及推理芯片需求的核心方案，正被英伟达、华为、阿里和谷歌等科技巨头推广。国产算力芯片在支持超节点和新一代数据格式方面取得进展，如华为的950系列、寒武纪的690和海光的身份四号，预示着国产超节点落地元年的到来。预计随着国产芯片的支持和优化，将大幅提升国产卡在大模型深度推理上的表现，为国产算力市场带来发展机遇。章节速览 00:00超节点算力需求与推理时代特征探讨对话围绕算力需求的转变展开，重点讨论了训练与推理对算力的不同需求，特别是推理时代的低延迟核心要求。介绍了推理算力的三个重要特征：高速光互联、算力池化、专用推理芯片，如华为的950 PD分离推理芯片。强调了这些技术进步对于提升数据处理速度和降低延迟的重要性，以及在实际应用中的表现。 04:33 PD分离与LPU：推理芯片的创新与应用对话探讨了PD分离理念，即在推理过程中将preview阶段与decode阶段分离，以降低内存带宽需求，降低成本并提升速度。华为已率先实现这一理念，推出950PR芯片。此外，英伟达的LPU旨在加速首个token的生成，但无法替代高性能算力卡，两者在推理芯片中分工合作。高速光互联、算力池化及新兴推理芯片如PD分离与LPU，共同构成了拖地时代算力芯片的典型特征，超节点成为这些特征的综合表现形式，尤其适用于大模型的深度推理。 08:45超节点：大模型深度推理的核心表现形式对话讨论了超节点作为大模型深度推理的关键表现形式，其优势在于能高效处理MOE架构下的专家模型，通过激活部分参数进行推理，从而降低成本、提升效率。超节点集高速度、光互联、算力池化和推理芯片于一体，满足推理算力需求，随着推理需求增长，超节点将更广泛应用于大模型推理领域。 12:12国产超节点芯片技术突破推动市场上涨对话探讨了国产芯片在支持大模型深度推理方面的能力提升，特别是新推出的芯片如华为950系列、寒武纪690等，这些芯片支持超节点和新数据格式，标志着国产超节点落地的元年。由于去年的芯片不支持主流数据格式FP8，导致算力需求增加时股价未涨，而今年的新芯片解决了这一问题，提升了算力与Token消耗量的正相关性，预示着下半年国产超节点落地将加速。 15:59国产芯片与超节点技术推动算力市场发展对话讨论了国产芯片在AI推理和训练领域的最新进展，特别是华为950系列芯片、华韩、武金、海光等公司推出的新一代国产芯片，以及阿里云的PPU芯片。这些芯片在性能上有了显著提升，能够更好地支持大模型的深度处理。此外，还分析了产业链中的连接器和交换机芯片的市场预期及股价空间，强调了国产算力市场在推理时代的机遇，以及超级节点技术对算力提升的关键作用。 21:07国产算力卡助力大模型深度推理对话强调了在推理时代，算力需求以低延迟为核心，高速光互联、算力石化及推理芯片成为关键特征，超节点作为主要落地形式，被看好用于大模型深度推理。国产算力卡，如华为950、海光深刻四号等，支持超节点及新一代数据格式，性能更优，预示着国产卡在大模型推理领域的广阔前景。发言总结发言人2 他，即西部证券的副所长、科技行业首席分析师郑宏达，在发言中主要讨论了算力需求在推理和训练阶段的不同，特别强调了推理时代对低延迟算力的迫切需求。他指出，为满足这一需求，行业正在发展三个关键特征：高速的光互联、算力池化和推理芯片。华为的950PR作为首款PD分离推理芯片已实现商业化，标志着国产算力芯片的重要进展。讨论还涉及了超节点的概念，强调其作为实现大模型深度推理的高效架构形式的重要性。他提到，今年是国产超级节点的落地元年，得益于新一代国产算力芯片的支持，这些芯片能够满足大模型推理的需求，预示着国产算力在推理时代将面临巨大机遇。整个发言涵盖了算力发展的最新趋势、技术特征以及国产算力芯片的市场前景，表达了对国产算力未来发展积极看好的态度。发言人1 他首先强调了本次西部政宏达会议对国产超节点的重视，提醒参会者会议内容仅供西部证券研究客户参考，不构成投资建议，参会者需自行承担投资风险。同时，他指出专家发言不代表公司观点，强调会议内容需合法合规，以避免引发股价异常波动或影响市场稳定。此外，他强调未经授权不得复制、转载会议内容，否则将承担法律责任。最后，他对参会者表示感谢，并推荐使用AI工具和进门APP获取更多投研内容。要点回顾在算力方面，推理和训练对算力的需求有何不同？发言人2：推理时代和训练时代对算力的需求是完全不一样的。训练对算力的需求是规模和稳定性，需要构建大规模集群（如一万卡甚至10万卡）并尽可能减少宕机次数以保证训练过程稳定。而推理时代的核心需求则是低延迟。推理时代对算力有哪三个重要特征？发言人2：推理时代对算力有三个重要特征：首先，高速的光互联技术被用于加快数据传输速度，实现低延迟；其次，算力池化，即将计算单元和存储单元做成池化，方便快速调取，从而降低延迟；最后，推出专门的推理芯片，如英伟达的LPU和华为的950系列，它们在推理过程中根据不同的阶段（preview阶段和decode阶段）需求，优化内存带宽使用，降低成本并提升速度。什么是PD分离技术，以及它如何应用于推理芯片中？LPU在推理过程中的作用是什么？发言人2：PD分离（Preview和Decode分离）是一种理念，由英伟达提出，主要针对推理过程中的两个阶段：打字输入阶段（preview阶段）和模型回答阶段（decode阶段）。在PD分离的推理芯片中，如华为的950系列，预览阶段只需较小的内存带宽，而解码阶段则需要高速内存带宽。通过将两个阶段分离，可以降低成本、提升速度，并非训练芯片所需，而是针对推理优化。LPU（由英伟达推出）是在算力卡上添加的小型存储模块，其主要目的是提高出第一个token（即AI模型回答的第一个字符）的速度。尽管LPU能显著降低第一个token的响应时间，但它并不能替换掉如HBM等大容量高速内存的使用，而是与之分工合作，共同完成推理过程。超节点如何体现推理时代的算力需求特征？发言人2：超节点是高速光互联、算力池化以及新兴推理芯片等特征的综合表现形式，尤其在应对推理任务时具有更好的性能表现。通过构建超节点，可以更好地利用这些特性进行深度推理，从而提高整体的推理效率和效果。超级点是什么，它在大模型中扮演了什么角色？为什么使用超级节点对大模型进行推理更方便？发言人2：超级点可以通俗理解为由几十甚至上百张卡组成的集群，例如谷歌的64卡timber集群就是一个超节点。现在包括英伟达、阿里、谷歌和华为在内的多家公司在研发自己的超级点，并预计今年超级节点将大规模普及推广。在大模型深度推理中，超级节点作为核心表现形式，由于大模型通常采用MOE架构（混合专家模型），将众多小模型放在超级节点内，方便激活部分小模型进行推理，从而提高效率和便捷性。大模型在深度推理时仅激活部分参数，而非全部。将这些被激活的小模型或expert分散放在不同的节点和服务器中，通过超级节点实现灵活激活，读取并利用其他节点的存储和计算资源，这样就极大地简化了推理过程，提升了效率和成本效益。国产新一代芯片与大模型消耗量之间有何关系？发言人2：目前，国产新一代芯片如华为950系列、寒武纪690和海光身份四号等，均能实现与大模型深度推理同步增长，基本保持正比关系（考虑优化因素）。随着这些芯片对大模型深度推理的支持和算力的增强，国产超级点的落地将更快更多，这也解释了为什么相关国产芯片公司的股价开始上涨。为什么今年被认为是国产超级点的元年？发言人2：今年被视为国产超级点元年，是因为国产新一代算力芯片开始全面支持大模型深度推理，包括FP8数据格式，并且可以构建超节点。之前的老一代国产芯片在处理大模型深度推理方面效果一般，但今年推出的华为950系列、寒武纪690以及海光身份四号等新芯片，不仅支持超节点和FP8数据格式，算力能力也有所提升，因此今年成为国产超节点落地的元年。华为产业链中连接器市场的竞争格局如何？华为产业链中还有哪些其他相关公司或产品？发言人2：华为产业链中的连接器市场主要由华丰科技、英华股份和航天电器等公司占据主导地位。此外，华韩、武金、海光等也在做自己的超节点，并且可以为客户提供超级节点的交付服务。华为寒武纪和海光今年将推出新一代国产芯片，如690及深圳四号线，性能相比之前大幅提升。市场对华为产业链上相关公司的估值策略是怎样的？发言人2：市场通常会根据华为950系列或阿里PPU的出货量，结合产业链中所需连接器、交换机芯片的数量及利润，来计算整体出货量的比值，从而推算出股价空间。对于盛科通信在华为产业链中的角色和市场空间怎么看待？发言人2：盛科通信作为交换机芯片的重要组成部分，在阿里云超节点落地中起到关键作用。根据预测，阿里云今年PPU出货量至少在35万颗以上，而每4颗PPU对应大约1颗盛科通信的交换机芯片，这意味着盛科通信有较大的市场空间。明年PPU出货量预计将达到70万颗，进一步推高了盛科通信的股价空间。对于寒武纪和海光这类已实现盈利的公司，市场如何看待它们的价值？发言人2：对于寒武纪和海光这类已实现盈利的公司，市场更关注它们自身收入利润的预测，并基于此给出PE估值进行估值。超节点在大模型深度推理中的地位是什么？：超节点是大模型深度推理的主要落地形式，能够通过高速光互联、算力、石化和推理芯片等三大特征实现低延迟、高效处理，满足规模化和稳定性的要求。国产超节点落地的重要性和国产卡的发展前景如何？发言人2：今年是国内国产超节点落地的关键一年，国产卡性能逐渐提升，能够更好地应对大模型深度推理的需求。随着推理时代的到来，国产卡支持超级点和新一代数据格式，更适合做大模型深度推理，因此看好国产算力的发展机会。

点击免费查看完整报告

再次强调今年要重视国产超节点20260414

核心观点与关键数据

技术细节与市场格局

研究结论

你可能感兴趣

通信周跟踪：英伟达computex强调边缘计算，超节点是国产算力重要元素

重视国产算力链超节点二波主升V4论文重点强调了超节点是必

中泰通信阿里云AI算力涨价34重视26年国产算力超节点带来的交换市场机会

再强调稀土这次重稀土要重视稀土供需政策战略的三重奏0225异动

我们在全市场都没看到机会的时候强调要极度重视应该有一定的发言权1T的

国金机械可回收火箭时间节点明确赴港上市便利情绪冰点已过重视核心国产链

宏观策略每周思考：外破产、内改革，今年对风险的重视要常态化

CT电新上游持续挺价行业出清加速再次强调重视近期光伏主链修复的机会

汽车行业周报：马斯克再次强调Optimus Gen3重要性，重视Q4机器人板块的投资机会

国联民生计算机再次强调重视3月金股寒武纪Token需求通胀主线的核