AI算力芯片与服务器弹性分析
主要观点:
训练与部署分析:
- Transformer模型:作为一种参数量可无限增长的通用模型,Transformer模型通过自注意力机制提高了并行性和可扩展性,适用于处理长序列输入和输出。相较于传统AI模型(如RNN和CNN),它在序列数据处理上更具优势。
- 训练效率:在4096颗A100 GPU互联下,训练10000亿参数模型需3-4周时间;若使用4096颗H100 GPU,这一时间缩短至一周左右。预计云计算企业每年需支持30-50个5000亿参数模型项目的训练,所需H100芯片数量约4000颗。
- 成本估算:基于4900万美元/集群的价格,支持GPT训练的云计算中心至少需投入1.96-3.92亿美元用于服务器购置。
部署市场评估:
- 强AI助手渗透:AI助手有望实现大规模渗透,推动服务器市场增长。
- 最高并发访问:以Steam为例,最高在线人数约为月活用户的6.19%-20.74%。假设国内8亿用户,最高并发访问人数可达4952万人至16592万人。
- 服务器需求量:AI带动的服务器需求量估计为5万台至16.6万台,对应芯片需求为50万至166万颗。
投资建议:
- 重点关注服务器和AI领域的公司,如海光信息、寒武纪-U、龙芯中科、澜起科技、工业富联、紫光国微、中芯国际、华虹半导体等。
- 上游晶圆制造与IP领域值得关注,如中芯国际、华大九天、概伦电子、芯原股份等。
- Chiplet领域则有兴森科技、通富微电、华正新材、方邦股份、长电科技等。
- 下游应用层面,涉及海康威视、大华股份、晶晨股份、瑞芯微、全志科技等。
风险提示:
- 技术迭代可能低于预期。
- 制裁风险。
- 市场发展可能未达预期,导致需求评估偏差。
结论:
AI算力芯片与服务器市场展现出巨大潜力,尤其是在训练和部署方面。通过提升计算效率和优化模型参数,可以有效降低训练成本和提高部署能力。然而,这一领域的快速发展也伴随着技术迭代、市场饱和和政策风险等挑战。投资建议聚焦于产业链各环节的领先企业,同时需密切关注潜在风险。