您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国内AI算力落地情况专家纪要–20250421 - 发现报告

国内AI算力落地情况专家纪要–20250421

2025-04-21未知机构故***
AI智能总结
查看更多
国内AI算力落地情况专家纪要–20250421

芯片采购预算:2025年字节跳动在大陆侧AI芯片的资本开支预算为400亿,其中约200亿用于购买NVIDIAGPU芯片,约200亿用于购买国产芯片,寒武纪与升腾各占80亿左右,其余三十多亿分给华三、浪潮等交付的相关国产芯片。海外还有五百多亿服务器整机预算,用于购买如GB200等规格型号产品,海外采购量多于国内。对国产芯片态度:现阶段仍认为国产芯片主要用于承接推理任务,但对国产芯片需求确定,后续也会持续采购。预计2025年5月后,国产芯片在云端租赁使用会增多。同时,对国产芯片的测试入库节奏正在正常推进,如寒武纪、海光、昆仑芯、摩尔线程等芯片都在加快测试入库,但新增预算和订单份额还需观望。对英伟达的态度及相关芯片情况:互联网公司对英伟达的信任在2023年11月及2024年7月相关事件后已不复存在,对其供应不抱稳定交付期待。2025年上半年国内能拿到的英伟达卡主要以H20为主,包括一些L20及可能短期未停运的A100。原计划2025年10月有B100和GB100芯片入库,但供应和价格存在不确定因素。H20虽可用于文本模型推理和训练,但性能并非想象中好,尤其是在多模态模型推理中,其进与不进对字节影响不大。不过,市场预期5月后H20及类似4090芯片有可能恢复售卖。 2、国产芯片产品分析 寒武纪:2024年Q4字节实际入库寒武纪机器1100多台,2025年Q1入库3500台,Q2计划入库4500-5000台。卡单价在20年底年框为6-8万,目前市场有涨价讨论,但字节希望按原合同交付台积电版芯片。同时字节与寒武纪在聊定制A4芯片用于模型推理。若台积电库存消耗完,可能转向三星,再其次考虑中芯南方厂,但中芯南方厂芯片性能较台积电版差且价格贵,需解决产能、良率及价格问题。昇腾:昇腾芯片依赖国内制程,7nm以上制程供应可能受限,因此920B或其改版方案可能在今明两年为主攻方案,2025年可能看不到下一代版本,2026年若国产产能和良率优化升级,可能有下一代芯片,性能、体积、功耗等方面会有变化。目前字节拿到的昇腾卡由超聚变厂商交付,华鲲振宇在去年下半年后恢复交付。对于昇腾910,具体规格不确定,之前预计其FP16在750左右,可能有HBM显存,不确定有无FP18精度,若性能不错且按时交付,字节会考虑采购。昆仑芯:昆仑芯在三星侧进度相对顺利,后续可能有更先进芯片。字节测试过昆仑芯P800,性能不错但因三星产能、合规及库存紧张问题,大量采购先暂停。同时因P800Spike超,字节可能推动采购P600。其他国产芯片:燧原芯B12已点亮,有望获得中芯国际7nm制程供应,且其在三星侧下一个新品可能在通信、HBM、FPGA及FP16或FP8硬件层表现更好。墨芯专注于稀疏计算的推理优化,字节会参与其C轮投资,其第二代芯片S20和S30今年底可能回片,字节可能购买。海光、摩尔线程、天数等国内公司芯片也在正常推进中,2025-2026年量产交付的卡很多基于2023-2024年设计,可用性和易用性较之前会有提升。 3、芯片供需与市场动态 训练与推理芯片需求比例:2024-2025年字节跳动训练算力支出预算占比七成到八成,推理占比二到三成。但2025年年内推理所需算力比值可能拉齐,2026年推理需求可能快速超过训练。训练资源可随时间推移转为推理资源。算力租赁情况:字节对水货算力租赁持谨慎态度,因合规问题尚未通过业务线报备,虽在讨论但不看好,不过在尽可能合规前提下可能租一些三方算力。关注算力租赁公司时,不应只看数据中心位置,更要看其手里卡的情况,越新越好。目前市场上承接算力租赁的公司,若卡为A800或更老芯片,意义不大,因模型公司对芯片要求在提高。国产芯片应用场景:国产芯片可用于文本推理、图像理解、视频生成模型等推理场景,但在性能上与英伟达芯片相比还有差距,需要原厂公司工程师共同寻找解决方案提升性能。在AI定制芯片方面,海外与博通合作因台积电无法流片暂停,后续可能讨论转向三星交付,但因美国政策限制,即使做出卡也可能无法运回国内;国内方面,字节与新源、中芯微、寒武纪等在聊合作,倾向于国内设计、量产、交付,但目前很多内容还 不确定,字节自研ASIC是确定会做的。