AI智能总结
英伟达下一代RUBIN架构性能阶跃式提升,迭代速度打破摩尔定律 —计算机行业周报 投资要点 推荐(维持) ▌算力:A100-80G租赁价格有所下降,英伟达下一代RUBIN架构性能阶跃式提升 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 本周算力租赁平台显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时,租赁价格有所下降。产业动态上,6月2日英伟达CEO兼创始人黄仁勋于Computex 2024上预告了将于2026年、2027年分别推出Blackwell的下一代Rubin架构的首款产品R100与Rubin Ultra系列产品。新一代Rubin平台架构采用X1600 IB/Ethernet Switch,与上一代Blackwell Ultra相比,可实现GPU数量由十万个到百万个的阶跃式提升。 ▌AI应用:智谱AI开源GLM-4 9B系列模型,智能体能力显著增强 6月5日,智谱AI宣布开源其GLM-4-9B系列模型,本次开源的GLM-4-9B系列包括:基础版本GLM-4-9B(8K),对话版本GLM-4-9B-Chat(128K),超长上下文版本GLM-4-9B-Chat-1M(1M)和多模态版本GLM-4V-9B-Chat(8K)。 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:Mistral发布首个AI代码模型Codestral,有望成为开源编程大模型先锋》2024-06-022、《计算机行业周报:微软推出COPILOT+PC,“主动式AI”或将开启个人电脑新时代》2024-05-263、《计算机行业周报:GPT–4o场景理解力阶跃式提升,“贾维斯时刻”或即将到来》2024-05-20 GLM-4在多个方面实现了显著改进,提升推理速度,大幅降低推理成本。此外,GLM-4-9B显著增强了智能体能力,能够自主根据用户意图,自动理解,规划复杂指令,并灵活调用网页浏览器,代码解释器和多模态文图大模型,以高效完成复杂任务。 ▌AI融资动向:Cohere获4.5亿美元D轮融资 本期AI初创公司的融资中,Cohere/Pika融资额前二,分别为4.5亿/0.8亿美元。Cohere专注于构建NLP模型平台,并采用API技术用于编写和理解自然语言,从而实现人类与机器的语言交互,致力于为开发者提供相关的机器语言处理解决方案。Pika聚焦于生成式视频模型,本次融资过后,Pika计划对软件进行升级,新版本支持生成更高质量、更长时间的视频片段。 ▌投资建议 英伟达将以“一年一代”的节奏推出新的AI芯片,行业龙头 正驱动全球AI芯片产业开启“技术性洗牌”。AI芯片加速迭代的背后是AI服务器市场在2024年将保持强劲增长势头,预计多数ODM厂商的AI服务器出货量和市场份额将实现两位数的增长,特别是搭载高端AI芯片,如英伟达H系列和AMD MI系列的机型等出货量有望实现翻倍。 建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:A100-80G租赁价格有所下降,英伟达下一代RUBIN架构性能阶跃式提升...............41.1、数据跟踪:A100-80G租赁价格有所下降..............................................41.2、产业动态:英伟达宣布新一代Rubin架构,容量与性能实现阶跃式提升...................42、AI应用动态:智谱AI开源GLM-4 9B系列模型,智能体能力显著增强..........................62.1、流量跟踪:5月360AI搜索访问量环比+332.79%.......................................62.2、产业动态:智谱AI开源GLM-4 9B系列模型,进一步推动大模型渗透布局.................83、AI融资动向:COHERE获4.5亿美元D轮融资................................................94、行情复盘...............................................................................105、投资建议...............................................................................126、风险提示...............................................................................12 图表目录 图表1:本周算力租赁情况...............................................................4图表2:英伟达智能芯片路线图...........................................................4图表3:Blackwell Platform产品展示.....................................................5图表4:Rubin Platform产品展示........................................................5图表5:Blackwell平台与Rubin平台产品对比..............................................5图表6:Spectrum-X扩展节奏曲线........................................................6图表7:2024.5.28-2024.5.31 AI相关网站流量.............................................6图表8:2024年5月全球AI增速榜.......................................................7图表9:对话模型典型任务测评结果.......................................................9图表10:基座模型典型任务测评结果......................................................9图表11:GLM-4V-9B多模态能力展示.......................................................9图表12:本周AI初创公司的融资动态.....................................................10图表13:本周指数日涨跌幅..............................................................11图表14:本周AI算力指数内部涨跌幅度排名...............................................11图表15:本周AI应用指数内部涨跌幅度排名...............................................11图表16:重点关注公司及盈利预测........................................................12 1、算力动态:A100-80G租赁价格有所下降,英伟达下一代Rubin架构性能阶跃式提升 1.1、数据跟踪:A100-80G租赁价格有所下降 本周恒源云A100-80G租赁价格有所下降,其余环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的价格为9.00元/时。 1.2、产业动态:英伟达宣布新一代Rubin架构,容量与性能实现阶跃式提升 6月2日,英伟达CEO兼创始人黄仁勋于Computex2024上分享了新半导体路线图,预告了将于2026年、2027年分别推出Blackwell的下一代Rubin架构的首款产品R100与Rubin Ultra系列产品。同时,英伟达承诺将以“一年一代“的节奏推出新的AI芯片,更新频率相比之前明显增快,凸显其在激烈的AI芯片市场军备竞赛中保持领先地位的决心。 Rubin架构实现高宽带储存技术新跃升。将于2025年推出的Blackwell使用的仍是8层HBM3e标准的高带宽内存,每个堆栈仅有1024位接口。与此前推出的Blackwell GPU架构相比,Rubin架构的一大创新是其首次集成了8层HBM4高带宽储存技术,而RubinUltra系列则进一步升级,支持12层HBM4储存技术。新一代HBM4高带宽内存技术采用更宽的2048位内存接口,这意味着Rubin架构将实现容量与性能双项提升。 资料来源:NVIDIA,华鑫证券研究 资料来源:NVIDIA,华鑫证券研究 Rubin平台产品全面更新,超级芯片Vera Rubin性能倍增。CPU方面,此前英伟达公布的于2024-2025年推出的BlackwellGPU仍与Grace CPU融合,而Rubin GPU将与新一代的Vera CPU融合并同步推出,共同构成Vera Rubin超级芯片,实现由Grace Black well到Vera Rubin的芯片迭代,其目标是超越现有的Grace Hopper超级芯片。传输速率方面,Rubin架构将采用新一代NVLink 6 Switch,连接速率高达3600Gpbs,速率是NVLink 5的两倍。同时,Rubin平台还采用CX9 SuperNIC组件,其速率可达1600Gpbs,数据传输效率比之Blackwell平台有所提升。新一代Rubin平台架构采用X1600 IB/Ethernet Switch,与上一代Blackwell Ultra相比,可实现GPU数量由十万个到百万个的阶跃式提升。 资料来源:NVIDIA,华鑫证券研究 2、AI应用动态:智谱AI开源GLM-4 9B系列模型,智能体能力显著增强 2.1、流量跟踪:5月360AI搜索访问量环比+332.79% 本期(2024.5.28-2024.5.31)AI相关网站流量数据:访问量前三位分别为ChatGPT(694.7M)、Bing(308.4M)和Discord(259.0M);访问量环比增速前三位分别为文心一言(8.42%)、Character.AI(5.17%)和NotionAI(1.66%);平均停留时长前三位分别为Character.AI(0:15:11)、Canva(0:10:02)和Midjourney(0:10:02);平均停留时长环比增速前三位分别为天工AI(1.92%)、文心一言(1.09%)和Character.AI(0.89%)。 图表7:2024.5.28-2024.5.31 AI相关网站流量 本 期 (2024.5)AI增 速 榜 单 中 , 月 访 问 量 环 比 增 速 前 三 位 分 别 为360AI搜 索(332.79%) 、 天 工AI(328.44%) 和Aistote(78.85%); 三 者 的 访 问 量