AI智能总结
1.国产算力发展现状与趋势 ·国产芯片的云端应用: 。2024年5月后,国产芯片(如华为升腾、寒武纪等)将更多以云租赁形式提供服务,而非直接线下交付。 。国产芯片目前主要承接推理任务,训练任务仍依赖英伟达等海外芯片,但未来可能逐步替代(如百度昆仑芯P800支持万卡互联训练)。 。国产芯片性能与性价比仍需提升,部分厂商(如寒武纪)依赖台积电/三星代工,国内制程(如中芯国际)良率较低,影响交付和成本。 ·重点国产芯片进展:。华为升腾: ·910B当前主力,920C预计2024年交付(FP16算力提升),下一代芯片或需等到2026年。 ·依赖国内7nm制程,产能优先供应华为自身需求(如手机芯片)。。寒武纪: ·590(台积电版)性能较好,但三星/中芯版本良率低、成本高:580 (FPB支持)可能成为补充。 ·2024年Q1字节入库3500台寒武纪服务器,全年计划采购10—12万张卡。 。昆仑芯(百度); ·P800支持大规模训练(如文心一言),但价格高:P600可能成为替代选项, 其他厂商:摩尔线程、海光等也在测试中,但量产能力有限。2.字节跳动的算力采购策略 ·预算分配: 。2025年国内预算:约400亿,其中200亿投向英伟达(如H20),200亿投向国产芯片(升腾、寒武纪各80亿,其余分给华三、浪潮等), 海外预算:超500亿,主要采购英伟达高端卡(如GB200、B200)。芯片选择逻辑: 。训练vs推理 ·当前训练需求占比70%—80%,依赖英伟达芯片:推理逐步转向国产芯片(如开腾910B、寒武纪590)。 ·多模态模型(图像/视频)仍需FP16精度,H20(FP8为主)性能不足, 。英伟达供应风险: ·H20国内交付可能暂停(合规问题),但水货渠道(如A100/H100)仍存在(月均1—1.5万张)。 ·字节严格规避非合规卡,但考虑租赁第三方算力(需审核供应商卡源)。 ·国产替代进展: 。测试加速:寒武纪580、昆仑芯P800、摩尔线程S5500等正在加快测试入库。。自研ASIC芯片:与博通合作因制程限制暂停,国内转向燧原、墨芯(专注稀疏计算)等厂商探索定制方案。 3.行业关键问题与挑战 ·制程瓶颈:国产7nm及以下制程产能不足,影响升腾、寒武纪等下一代芯片进展。 ·性价比矛盾:国产芯片价格高(如寒武纪中芯版良率仅30%—40%),需政府补贴或厂商让利。 ·政策影响: 。美国禁令导致英伟达特供芯片(如H20)供应不稳定,推动国产采购。。工信部要求国产化比例(如30%),但未强制具体厂商。 4.未来展望 ·2024下半年重点: 英伟达H20是否恢复供应:国产芯片(如升腾920C、寒武纪580)批量交付能力。 。多模态模型推动FP16需求,国产芯片需提升算力密度和互联性能。 ·长期趋势: 。推理算力需求或超过训练(2026年后),国产芯片在垂类场景(如文本/视频生成)机会更大。 。互联网大厂自研芯片趋势明确(如字节、百度),第三方厂商需聚焦差异化 (如墨芯的稀疏计算)。 5.专家核心观点 ·国产芯片:“能用但不够好用”,需在算法适配、集群方案(如开腾300卡互联)上优化 ·英伟达:地缘政治下供应风险长期存在,但高端卡(如GB200)在海外市场仍不可替代。 ·投资方向:关注能稳定获取先进制程(如星/中芯7nm)的商,以及垂类场景专用芯片(如推理优化)。 注:会议中多次提及音频问题,部分内容可能存在重复或听录误差,但核心逻辑保持一致。