AI智能总结
优于大市 核心观点 行业研究·行业月报 计算机 AIASIC:价格、功耗优势显著,市场规模快速增长。1)价格优势:由于GPU芯片强大的通用性、灵活性,其设计及流片成本较高,进而导致GPU的平均单价较高;根据IDC统计数据,2024年GPU平均单价为8001美元,AIAsic平均单价为5236美元,AIASIC具备价格优势;2)功耗优势:由于AIAISC芯片偏定制化设计,专为特定任务(例如AI大模型的训练或推理)优化,因此其在执行特定任务时功率较低。3)市场规模:根据IDC披露数据,2024年GPU、AIASIC芯片市场规模分别为701、148亿美金,预计2030年分别增长至3263、838亿美金,对应24-30年CAGR分别为29.2%、33.5%。从出货量来看,2024年GPU、AIASIC芯片出货量分别为876、283万颗,预计2030年增长至2982、1431万颗,对应24-30年CAGR分别为22.6%、31.0%,AIASIC芯片占比稳步提升。分领域来看,ASIC芯片在训练、训练&推理双用AI芯片领域,增速快于GPU。 优于大市·维持 证券分析师:库宏垚021-60875168kuhongyao@guosen.com.cnS0980520010001 证券分析师:熊莉021-61761067xiongli1@guosen.com.cnS0980519030002 证券分析师:艾宪0755-22941051aixian@guosen.com.cnS0980524090001 联系人:云梦泽021-60933155yunmengze@guosen.com.cn 联系人:蔺亚婴联系人:侯睿linyaying@guosen.com.cnhourui3@guosen.com.cn 复盘谷歌TPU发展历程,AIASIC三大发展趋势逐步明朗。我们对全球AIASIC龙头谷歌TPU进行复盘,AIASIC芯片发展呈现三大发展趋势。1)专用性持续增强,颗粒度更细:特别是TPUv5分为了TPUv5e和TPUv5p两个版本,其中TPUv5e是训推一体,强调成本效益,而TPUv5p性能强劲,专注于超大基础模型训练,芯片应用场景更细分;2)更强的算力、HBM和集群能力:单卡算力持续提升,选用更领先的HBM(应对多模态任务),单POD芯片数量持续提升,集群拓展效率逐步接近线性;3)能效比持续提升:以单芯片封装每瓦热设计功耗所提供的峰值FP8Flops衡量,Ironwood峰值能效是上一代Trillium的2倍,是TPUv2的29.3倍;同时,TPUv3开始配套液冷,液冷等新一代冷却方式逐步应用。 资料来源:Wind、国信证券经济研究所整理 相关研究报告 稳定币:香港政策落地,关注板块投资机会。香港于2025年5月21日正式通过《稳定币条例》,解决稳定币行业长期存在的透明度不足、赎回风险等问题,同时为合规机构开辟清晰的入场路径。1)提升跨境支付效率和普惠性:稳定币在交易速度、成本以及体制方面显著优于传统跨境支付体系,绕开SWIFT体系的低效性,重构全球金融包容性格局;2)赋能RWA资产链上化与全球流通:稳定币通过价值锚定、效率革命、合规护航、流动性激活,破解RWA项目的价格波动、跨境摩擦、信任缺失与门槛高等痛点。 《计算机行业2025年6月暨中期投资策略-AI产业快速迭代,持续看好Agent和算力租赁》——2025-06-13《稳定币香港政策落地,关注板块投资机会》——2025-06-04《人工智能专题报告:国内大厂扩张资本开支,算力租赁订单持续落地》——2025-05-21《计算机行业2025年5月投资策略暨财报总结-大厂布局Agent产品,AI应用快速落地》——2025-05-08《人工智能行业专题:2025Q1海外大厂CapEx和ROIC总结梳理-20250505》——2025-05-05 投资建议:看好AIASIC及稳定币。谷歌、亚马逊、Meta等公司纷纷加快ASIC芯片的自研和测试;国内受AI芯片禁令影响,英伟达先进AI芯片对华出口受限,互联网大厂可能转向AIASIC芯片,服务器厂商有望充分受益;同时,国产算力芯片25年有望快速放量,建议关注海光信息等。同时,香港《稳定币条例》落地,稳定币有望提升跨境支付效率,建议关注新大陆等公司。 风险提示:互联网大厂AIASIC研发进展不及预期;云厂商资本开支投入不及预期;稳定币发行进展不及预期。 内容目录 AIASIC芯片:市场规模快速增长,三大发展趋势逐渐明朗...........................5 AIAsic芯片:价格、功率优势明显,市场规模快速增长....................................5复盘谷歌TPU:更专用、强算力、大集群、高能效..........................................8 稳定币:香港政策落地,关注板块投资机会.......................................17 香港《稳定币条例》落地,以合规框架激活数字金融创新...................................17稳定币蓬勃发展,跨境支付+RWA有望收益................................................18 投资建议:看好AIASIC及稳定币................................................20 风险提示.....................................................................20 图表目录 图1:不同类型AI芯片对比.................................................................5图2:GPU和AIASIC平均单价及预测.........................................................6图3:AI芯片算力和功率矩阵图..............................................................6图4:24Q4各厂商AI芯片收入占比...........................................................7图5:推理、训练侧芯片类型TAM(2024vs2030)...............................................7图6:GPU、AIASIC芯片市场规模情况(单位:十亿美金)......................................7图7:GPU、AIASIC芯片出货量情况(单位:万颗)............................................7图8:谷歌TPU发展历史....................................................................8图9:TPUv1 FloorPlan...................................................................9图10:TPUv1 BlockDiagram...............................................................9图11:TPUv1向TPUv2架构演进............................................................9图12:TPUv2芯片包含两个相连的Tensor Core..............................................10图13:TPUv2 Floorplan..................................................................10图14:TPUv3延续v2架构,性能提升.......................................................10图15:TPUv4 MXU数量翻倍,峰值算力大幅提升..............................................11图16:谷歌超级计算机互联结构(Cube)....................................................11图17:可重配置光互连技术提升计算机的稳定性..............................................11图18:谷歌TPUv4性能表现优于英伟达A100.................................................12图19:谷歌TPUv4性能表现略逊于H100,但功耗管理能力出色.................................12图20:谷歌TPUv5e架构..................................................................12图21:谷歌TPUv4、TPUv5e、TPUv5p参数对比.............................................12图22:谷歌TPUv5e单美元推理性能性价比提升..............................................13图23:谷歌TPUv5e延迟相较于TPUv4进一步下降...........................................13图24:TPUv5ePod可承载2万亿模型运行...................................................13图25:TPUv6e(Trillium)同TPUv5e参数对比.............................................14图26:谷歌Trillium实现99%的拓展效率(12个Pod)........................................14图27:谷歌Trillum同TPUv5p拓展效率对比................................................14图28:谷歌Trillium训练效率对比(同TPUv5e)............................................14图29:谷歌Trillium对MoE架构模型训练能力大幅提升.......................................14图30:谷歌Trillium推理效率对比(同TPUv5e)............................................15图31:谷歌Trillium推理性价比对比(同TPUv5e)..........................................15图32:TPUv4、TPUv5p、Ironwood芯片参数对比...............................................15图33:Ironwood(TPUv7)峰值性能大幅提升................................................16图34:Ironwoord(TPUv7)峰值能效大幅提升..........................................