AI智能总结
1:日活2000万需要8万张H800卡:2000万用户,满血版参数量6710亿,每次调用使用5000个token(读取网页及深度推理等操作输入输出token量较大),每天用10次,乘上经验常数6(6ND),可计算出整体算力需求量,除单卡FP16性能及算力卡利用率(60%); 2、H20正规供货路径已断,目前大厂发挥供应链渠道能力收库存,拿货进度并不顺畅; 【国君电子】大云厂专家交流takeways: 1:日活2000万需要8万张H800卡:2000万用户,满血版参数量6710亿,每次调用使用5000个token(读取网页及深度推理等操作输入输出token量较大),每天用10次,乘上经验常数6(6ND),可计算出整体算力需求量,除单卡FP16性能及算力卡利用率(60%); 2、H20正规供货路径已断,目前大厂发挥供应链渠道能力收库存,拿货进度并不顺畅; 3、1300亿资本开支未考虑下调,服务器占比60多%,服务器内占比,昇腾45%,hwj15%,平头哥10%,hgxx15%,其余H20; 4、昇腾供应链有保障,软件适配快,25年10万颗指引,25年国产卡里可做训练的只有昇腾芯片; 5、国产算力芯片均未支持FP8,目前是在软件层面把满血版FP8转为Int8格式,通用任务里FP8与int 8没有太大差别,复杂推理性能损失10-15%。 #持续坚定推荐昇腾产业链,华丰科技、中芯国际,受益公司兴森科技。