您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:中信前瞻英伟达2026GTC大会核心内容 - 发现报告

中信前瞻英伟达2026GTC大会核心内容

2026-03-18未知机构路***
中信前瞻英伟达2026GTC大会核心内容

【财务及经营数据】1、公司在此次会议上预计2027年GPU的订单需求将增长至1 万亿美元。 2、目前,英伟达60%的业务来自全球前五大超大规模云服务商,剩余40%遍布区域云、主权云、企业、工业、机器人、边缘计算等各个领域。 【Vera Rubin】专为AI智能体工作负载设计 【中信前瞻】英伟达2026GTC大会核心内容——————- 【财务及经营数据】1、公司在此次会议上预计2027年GPU的订单需求将增长至1 万亿美元。 2、目前,英伟达60%的业务来自全球前五大超大规模云服务商,剩余40%遍布区域云、主权云、企业、工业、机器人、边缘计算等各个领域。 【Vera Rubin】专为AI智能体工作负载设计,已全面投产 1、关键硬件亮点—计算:Vera CPU(采用LPDDR5的数据中心CPU),高单线程性能、高能效,适配AI 智能体工具调用—存储:BlueField 4 + CX 9,为AI时代全新存储平台,获全球存储行业全面支持—网络:CPO SpectrumX,量产共封装光学以太网交换机—机架/超算:Kyber机架支持144块GPU单NVLink域;Rubin Ultra为下一代超算节点,适配Kyber机架实现大规模互联 2、部署优势:100%液冷,45℃热水冷却,机架安装时间从2天缩短至2小时,大幅降低数据中心冷却压力 3、生态认可:获Anthropic、OpenAI、Meta、Mistral AI等头部企业认可 【Groq】:依托Dynamo推理调度软件实现与GPU的协同 1、为解决Groq SRAM容量较小无法单独承载大模型参数与KV Cache的问题,公司依托Dynamo推理调度软件解聚推理管线,实现Vera Rubin与Groq协同工作。 —Vera Rubin负责前填充+注意力解码(需大算力、KV Cache存储)。 —Groq负责前馈网络解码(token生成)(需高带宽、低延迟)。 —应用场景中:(a)针对于高吞吐场景推荐100%使用Vera Rubin;(b)针对代码生成等高价值token生成场景推荐采用25% Groq + 75% Vera Rubin。 2、Groq LP30芯片由三星代工,已量产,26Q3开始出货。 【Feynman】:全新芯片,网络方案支持铜缆与CPO 1、下一代架构Feynman,包含全新GPU、全新LPU (LP40)、全新CPU (Rosa)、BlueField-5 DPU以及ConnectX-10SuperNIC