行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

中泰电子大模型专家解读算力仍是长期确定方向1DS解读

2025-03-04 未知机构一切如初

1）DS解读：

算法层：通过MoE和大规模调度优化提升单节点吞吐率，稀疏化+量化压缩降低单次计算复杂度；
系统层：KV Cache复用，缓存命中高达56.3%，交互越多效率越高；
总结：技术实现难度高，头部大厂接近理想状态，多数厂商难以实现，实际落地算力需求高。

2）需求测算：

根据DS数据，每个H800节点输出14.8k token/s，平均每人每秒20-22token，倒推每张卡能服务88人；
假设1亿DAU，对应114万颗H800；
实际使用反馈效率较低，高峰期回答率仅20%，实际人均token量应更大，需考虑上下文长度；
后续to C如导入苹果服务等可能大幅增长DAU，算力卡需求远超测算；国产卡效率不及N卡，需求更大。

3）政策格局：

中美对抗加剧，H20潜在被禁风险升高，客户加速国产化储备；
当前模型基于NV芯片，断供将释放巨大空间，远超技术优化影响；
国产算力迎来真正1-10时刻。

1）DS解读：1）算法层：使用MoE和大规模调度优化，提升单节点吞吐率，稀疏化+量化压缩降低单次计算复杂度；2）系统层：KV Cache复用，缓存命中高达56.3%，交互越多效率越高；#总结：技术实现有难度，是理想状态下极限情况，头部大厂有能力复刻接近，多数厂商难以实现，实际落地算力需求高； 2）需求测算：根据DS数据，每个H800节点输【中泰电子】大模型专家解读，算力仍是长期确定方向 1）DS解读：1）算法层：使用MoE和大规模调度优化，提升单节点吞吐率，稀疏化+量化压缩降低单次计算复杂度；2）系统层：KV Cache复用，缓存命中高达56.3%，交互越多效率越高；#总结：技术实现有难度，是理想状态下极限情况，头部大厂有能力复刻接近，多数厂商难以实现，实际落地算力需求 2）需求测算：根据DS数据，每个H800节点输出14.8k token/s，平均每人每秒20-22token，倒推每张卡能服务88人；假设1亿DAU，对应114万颗H800；#总结实际使用反馈效率较低，高峰期回答率只有20%，实际人均token量应更大，此外需根据上下文长度判断。考虑后续to C如导入苹果服务等，DAU大幅增长，算力卡需求会远大于测算；国产卡效率不如N卡，需求更大； 3）政策格局：中美对抗，H20潜在被禁风险越来越高，客户加速国产化储备。截至目前大家的模型都是基于NV芯片，如果断供，释放出的空间，会大幅超过技术优化的影响，“国产算力会迎来真正1-10时刻”。

点击免费查看完整报告

中泰电子大模型专家解读算力仍是长期确定方向1DS解读

你可能感兴趣

中泰通信行业周报（0219-0225）：算力仍是最确定方向，政策支持央企发展AI

中泰电子胜宏科技25Q1大超预期算力PCB仍是最景气方向受

中泰电子沿主线买缺口先进存力和算力是最确定的方向AI需求

【东吴计算机】疫情反复之下，信创仍是最确定方向疫情反复之下，信创产业受到

中国国旅公司终止重大事项暨复牌点评：重大事项终止，改革仍是确定方向

2025百度CreateAI大会：AI应用探索仍是大模型落地方向

【广发计算机刘雪峰团队 |AI行业深度报告：多模态大模型方向确定，从通用到垂直场

AI芯片专家大模型对算力–20230401

【首创计算机】算力仍是最确定性方向

【首创计算机】算力仍是最确定性方向