您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国元国际]:人工智能行业报告:AI迭代短期产生爆发式硬件需求,产业整体仍处发展早期 - 发现报告

人工智能行业报告:AI迭代短期产生爆发式硬件需求,产业整体仍处发展早期

信息技术 2026-06-08 杨森 国元国际 单字一个翔
报告封面

AI迭代短期产生爆发式硬件需求,产业整体仍处发展早期 报 告 日 期 :2 0 2 6-0 6-0 8 研 究 部姓 名:杨 森S F C:B J O 6 4 4电 话 :0 7 5 5-2 1 5 1 9 1 7 8E-m a i l :y a n g s e n @ g y z q . c o m . h k 目录 一、AI性能快速迭代,商业落地推动AI Agent爆发 二、硬件产业链不得不全栈式、性能指数级进化以满足AI发展需求 三、AI产业仍处于早期,具有长足发展空间 四、AI硬件产业链的投资思路 五、风险提示 AI大模型迅速迭代,在某些专业领域已可以媲美人类 以ChatGPT为例。过去8年来,其运算能力呈现指数级增长: ➢参数量从1.17亿爆发式增长到了约1.8万亿,增长超过15000倍; ➢上下文窗口从约1000个词→200万token,增长超过2000倍。 性能和架构不断升级,使得ChatGPT在某些专业领域已可以媲美人类: ➢从"预测词语"到"理解意图":RLHF技术的引入,让模型不再只是机械地预测下一个词,而是学会了理解人类真正的需求。➢从"处理文字"到"感知世界":GPT-4引入多模态能力,模型开始能够看、能够听,突破了纯文字的限制。➢从"回 答 问 题"到"独 立 执 行":GPT-5系 列 具 备Agent能力,能够主动规划任务、调用工具并独立完成复杂工作。 盈利模式不断验证落地,AI Agent正进入商业爆发期 智能体(AI Agent)是由大语言模型或领域模型驱动,具备环境感知、推理决策及行动能力的系统。对企业或个人而言,在当前AI的智能水平下,AIAgent是能够自主规划、记忆、调用工具,帮助人类或独立完成相对专业任务的智能助手,从而具有商业价值。 ➢技术层面:AI Agent技术生态已趋于成熟,LangChain、AutoGen、CrewAI等开源框架为构建复杂Agent系统提供了坚实基础多智能体协作系统、特定领域语言模型和ComputerUse能力也有望实现重大突破; ➢商业层面:垂直行业应用将成为主战场,金融服务、医疗健康、制造业和客服领域将率先实现规模化部署。AIAgent正在大幅度提升社会生产效率,商业模式不断落地。举例而言:根据GitHub的数据,目前全球约3000万到4000万专业软件开发者,总薪资约3万亿美元。在AI辅助下,这些开发者现在产出的工作量相当于9万亿美元的生产力。 目录 一、AI性能快速迭代,商业落地推动AI Agent爆发 二、硬件产业链不得不全栈式、性能指数级进化以满足AI发展需求 三、AI仍处于早期,具有长足发展空间 四、AI硬件产业链的投资思路 五、风险提示 AI的性能迭代和大规模应用“迫使”硬件产业链极速进化 ➢AI自身性能和外部应用的指数级增长要求AI产业的硬件性能和供应量做到同步的指数级增长。但物理现实世界产能升级的速度低于产业需求增长的速度,造成多个硬件供应环节或持续进入量价齐升、供不应求的局面。 ➢当下,硬件不再是被动支撑软件的"底座",而是成为决定AI能力上限的核心瓶颈。 ➢整个产业链正经历从“芯片元件-服务器机柜-数据中心”的全栈式、革命性升级,硬件升级不再是单一环节的突破,而是芯片、封装、散热、电源、网络等多个环节的协同创新。 半导体:AI需求推动产业双位数增长 ➢半导体市场在AI应用驱动下呈现加速成长。2025年实际成长率达23%,远超前一年预估的10%。展望2026年,台积电预测市场将成长45%,存储器与非存储器产品均贡献成长动能。此成长幅度反映AI运算需求对半导体产业需求结构的影响,持续性成长动能跨越整个价值链。全球半导体市场迈向1兆美元的时程较原先预期提前数年。 ➢个人计算机、网际网络与智能型手机各自带动产业成长,但AI应用呈现更陡峭的加速曲线。台积电预估2030年全球半导体市场将超过1.5兆美元,AI为主要成长驱动力。此时程压缩反映机器学习工作负载对硅晶圆消耗量的影响规模。 先进工艺节点保障AI性能持续提升 ➢个人计算机、网际网络与智能型手机各自带动产业成长,但AI应用呈现更陡峭的加速先进逻辑节点、SoIC3D堆栈与CoWoS整合的协同组合驱动AI运算的指数扩展。从2024年至2029年,单一CoWoS封装内的运算晶体管总数将增加48倍。此扩展源自三个并行矢量:CoWoS Interposer尺寸从3.3倍扩展至超过14倍reticle尺寸、透过SoIC堆栈使系统单晶片数量从2颗增加至超过24颗,以及个别晶粒晶体管密度透过逻辑节点从N7进展至A14而改善。 ➢台 积 电 计 划2026年 导 入N3P-on-N4SoIC堆 栈 于 更 大 的5.5-reticle Interposer达 成4.6倍 扩 展。2027年 世 代 运 用N2P-on-N3PSoIC于9.5-reticleInterposer达到12倍扩展。2028年平台采用N2P-on-N2PSoIC于14-reticleInterposer达成32倍扩展。最终,2029年系统整合A14-on-A14SoIC于超过14-reticleInterposer,相对于2024年基准线超越48倍运算晶体管扩展。 系统集成拓展AI算力 芯片:从Blackwell到Rubin,英伟达GPU向Useful AI持续进化 ➢英伟达的GPU从初代迭代至今,已有二十六年历史。从最初主要面向图形处理,逐步拓展至通用计算、人工智能、光线追踪以及高性能计算等多个前沿领域。英伟达每一代的新架构都在不断推进计算能力的极限,也推动了整个AI产业链的发展; ➢2017年,英伟达推出Volta架构,首次将Tensor Core(张量核心)引入消费级GPU,开启了“AI原生架构”的新时代。每一代Tensor Core都代表了一次重大的架构升级,在支持的数据类型、计算吞吐量、能效比和专用功能上都有显著提升。至2024年推出的Blackwell架构,已迭代至第五代,伴随的是各项性能的指数级增长。 英伟达历代GPU性能演进➢2026年6月试产启动下一代AI平台Vera Rubin,首批产品将于7月向微软、谷歌、亚马逊、Meta、甲骨文等北美云厂商交付,第三季度进入批量生产阶段,第四季度实现产能爬坡。该平台采用台积电3nm制程工艺,集成72颗Rubin GPU和36颗VeraCPU,搭载新一代HBM4显存(高端版本支持1025GBHBM4e),推理性能较前代Blackwell架构提升35倍,单机架算力密度较Blackwell架构提升4倍。该平台支持高度复杂的分布式、异构计算,可以说是为了迎接“有用的AI”时代而专为AIAgent量身打造的平台。 AI Agent时代的算力重构,CPU会越来越重要 ➢未来的AI算力竞争,不再是单一硬件的比拼,而是CPU、GPU、内存、网络、先进封装协同发力的全栈式竞争。 ➢传统数据中心配比:过去,在AI训练和大语言模型为主的场景下,数据中心中CPU与GPU的配比通常为1:4甚至1:8,即每1颗CPU对应4颗或8颗GPU,此时GPU承担主要的计算负载,CPU主要负责调度和数据搬运。 ➢当前及未来趋势:随着AI进入“智能体时代”,智能体需要自主拆解任务、规划步骤、调用工具、处理数据等,这些工作主要由CPU完成,GPU仅负责模型推理环节。因此,CPU与GPU的配比正在从1:4或1:8向1:1靠拢,甚至在部分场景下CPU需求可能超过GPU。 目前行业巨头纷纷发布适应AIAgent时代的CPU,包括: 英伟达发布VeraCPU:该架构放弃了传统CPU的多核租赁模式,转而追求极致的单线程性能和带宽:•IPC:拥有全球最高的指令周期(IPC)•带宽:内部织网带宽达到3.6TB/s,内存带宽是高性能x86的2到3倍•效率:运行SQL的速度提升3倍,实时流处理性能提升6倍 AMD也发布了搭载Zen5架构的Venice系列CPU,已采用台积电2纳米工艺完成量产,主打高性能与高能效,卡位高端服务器市场。 存储:功能升级,供给或许“永远”跟不上需求 ➢从H100的80GB再到Rubin Ultra的384GB,英伟达每一代AI芯片的HBM搭载容量都在大幅提升。这一容量升级意味着即便AI芯片的出货量保持稳定,单芯片HBM容量的提升也会推动HBM总需求的持续增长。AI系统正在改变存储需求的结构:HBM是训练和高端推理的带宽核心,DDR/LPDDR承担CPU侧控制平面和通用内存,eSSD支撑推理数据、缓存、向量检索和高吞吐存取,HDD则继续承接冷数据和超大规模对象存储。也就是说,存储不再只是简单功能品类,而是AI系统每一层都要消耗的基础资源。 ➢此外,存储需求被用户数、使用时长、任务复杂度、推理token消耗等多个变量相乘放大。AI并不是只活跃在云端,手术室、工厂、汽车,凡是AI业务发生的场景,算力就必须在场。未来数以千亿计的AIAgent将时刻不停且极速地调用工具、访问长期记忆并进行推理规划,这需要依托顶级CPU构筑的底层设施来承载,使模型大脑真正转化为能执行任务的数字机器人。未来每个AIAgent都需要专属算力与存储,这意味着需求规模将有指数级增长空间。 英伟达历代GPU的HBM容量➢2026年6月初,SK海力士宣布大规模扩产计划,将在未来五年内将晶圆产能翻倍,以应对全球人工智能基础设施建设带来的内存芯片持续短缺。SK集团董事长崔泰源表示:全球存储芯片供应缺口可能持续至2030年,公司正加大资本支出以弥合供需失衡。 存储:结构性短缺或导致存储价格持续处于高位 ➢根据TrendForce集邦咨询最新存储器产业研究,AI发展从大型模型训练转向以推理为核心的AgenticAI(代理式AI)应用,驱动存储器需求结构性扩张,由于供给缺口短期无法补足,推升价格上涨。因此,Trend Force集邦咨询大幅上调全球存储器产值预估,将2026年产值从前一版的5,516亿美元提高至8,893亿美元,2027年则预计由8,427亿美元上修至逾1.28万亿美元,年增率约44%。 ➢其中:由于HBM对晶圆耗用量的增加,压缩Conventional DRAM可用产能。在需求扩张的情况下,更强化供应商对合约价的话语权,预估可支持涨势至2027年。因此,TrendForce集邦咨询上调2026年DRAM产值至6,187亿美元,年增率达303%;预计2027年产值将进一步成长至9,033亿美元,年增46%。 ➢由于需求强劲但供给紧张,NANDFlash价格获得支撑,TrendForce集邦咨询上修2026年全球NANDFlash产值达2,706亿美元,年增高达280.7%,2027年更将进一步扩大至近3,794亿美元,持续取得40.2%的年成长。 存储:结构性短缺或导致存储价格持续处于高位 ➢2026年6月市场研究机构集邦咨询Trend Force发布最新研究指出,三大存储原厂三星电子、SK海力士、美光将于2027年大幅调高HBM高带宽存储器的报价。这一判断的核心依据是:DRAM供不应求的市况、新旧世代HBM的高制造难度及高成本,以及HBM对普通DRAM产能的挤占效应在2027年将更加严重。集邦咨询指出自2025年下半年以来,普通型DRAM价格大涨反映出供不应求的形势。但由于三大原厂的HBM采用年度议价机制,导致HBM合约价无法及时反映市场的季度涨价趋势。 ➢据市场估算,HBM总可寻址市场(TAM)规模在2023–2027年间快速扩张,从2023年的约30亿美元升至2027年的约850亿美元。其中GPU用HBM2024–2027年复合增长率为73%,ASIC用HBM同期复合增长率为88%,ASICHBM增速高于GPUHBM。随着HBM芯片尺寸的扩大和需求的增加,HBM消耗的晶圆产能也在增加。由于HBM每GB消耗的晶圆产能约是普通DRAM的三倍,HBM产能的扩大会直接挤占普通DRAM的产能。 AI服务器:受益于A