您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化 - 发现报告

计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化

信息技术2024-06-16宝幼琛华鑫证券H***
AI智能总结
查看更多
计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化

AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化 —计算机行业周报 投资要点 推荐(维持) ▌算力:算力租赁价格平稳,AMD Instinct产品线更新MI325X同步英伟达 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 本周算力租赁价格环比持平。在产业动态方面,近期,AMD董事长兼CEO苏姿丰在Computex 2024展会的开幕主题演讲中公布了今年将会推出Instinct MI325X,2025年推出MI350,2026年推出MI400。MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s。与英伟达相比,MI325X内存大小和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍,可谓是AMD史上最大的AI性能提升。同时,MI350的内存容量将是英伟达2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。AMD预计将在2026年推出基于CDNA "Next"架构的Instinct MI400加速器系列,一年一更同步英伟达。 资料来源:Wind,华鑫证券研究 ▌AI应用:苹果发布Apple Inteligence智能 系统,正式开启端侧AI新时代 相关研究 1、《计算机行业动态研究报告:车路一体化项目接连启动,智慧交通市场有望提质增速》2024-06-112、《计算机行业周报:英伟达下一代RUBIN架构性能阶跃式提升,迭代速度打破摩尔定律》2024-06-103、《计算机行业周报:Mistral发布首个AI代码模型Codestral,有望成为开源编程大模型先锋》2024-06-02 当地时间6月10日,苹果发布了Apple Intelligence,一款深度集成于iOS 18,iPadOS 18和macOS Sequoia的全新个性化智能系统。Apple Intelligence由多种智能生成模型组成,端侧云端混合并行,专为用户日常任务设计。端侧上,Apple Intelligence拥有约30亿参数的语言模型。在设备端和私有云上,苹果对模型生成的第一个token和后续token的推理过程进行了优化,采用分组查询注意力机制、共享的输入和输出词汇嵌入表。设备端模型词汇量为49000,服务器模型为100000,在iPhone 15 Pro上,从接收到提示词到生成第一个token所需时间约为0.6毫秒,生成速率为每秒30个token。在AppleIntelligence的加持下,Siri的智能化水平进一步提升,具备更丰富的语言理解能力和用户交互体验。 ▌AI融资动向:Mistral AI获6.4亿美元B轮融资 本期AI初创公司的融资中,Mistral AI / Cognigy融资额前二,分别为6.4亿/1.0亿美元。Mistral AI是欧洲最强的LLM大模型公司, 在多模态、检索增强生成(RAG)等大模型突破方向有着丰富经验,曾开发Mistral 7B、Mixtral 8x22B等模型,是OpenAI的强劲对手。Cognigy作为AI客服巨头,专注于对话式AI和生成式AI的研究与开发工作,本次融资用于加速AI自动化技术的研发,并推动其全球扩张。 ▌投资建议 巨头入场加速端侧AI发展。2024年AIPC和AI手机的加速落地标志着AI发展的重点逐步向端侧转移,特别是此次WWDC大会上苹果发布的Apple Intelligence体现了AI颠覆传统消费电子设备体验的潜力。基于此,我们建议关注:1)端侧AI优化手机等产品使用体验,大幅提升生产力,有望加速3C换机周期,建议关注AIPC、AI手机硬件产业链;2)Apple Intelligence推理采用端侧和云侧相结合的方案,有望进一步拉动推理算力需求。 建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:算力租赁价格平稳,AMD INSTINCT产品线更新MI325X同步英伟达...................41.1、数据跟踪:算力租赁价格平稳......................................................41.2、产业动态:Instinct产品线一年一更同步英伟达,新款MI325X算力峰值较H200快1.3倍..42、AI应用动态:苹果发布APPLE INTELIGENCE智能系统,正式开启端侧AI新时代.................62.1、流量跟踪:天工AI访问量环比+16.37%..............................................62.2、产业动态:苹果发布Apple Inteligence智能系统,正式开启端侧AI新时代..............73、AI融资动向:MISTRAL AI获6.4亿美元B轮融资............................................114、行情复盘...............................................................................125、投资建议...............................................................................136、风险提示...............................................................................13 图表目录 图表1:本周算力租赁情况...............................................................4图表2:2024-2026年Instinct GPU路线图.................................................4图表3:MI325X性能展示图..............................................................5图表4:MI325X与H200性能对比表........................................................5图表5:MI350性能展示图...............................................................6图表6:CDNA 4与CDNA 3推理能力对比图..................................................6图表7:MI350与B200性能对比图........................................................6图表8:2024.6.5-2024.6.11 AI相关网站流量..............................................7图表9:摘要用例评估响应占比...........................................................8图表10:苹果基础模型与可比较模型回答首选占比..........................................8图表11:敏感有害内容违规率............................................................8图表12:安全性prompt回答首选率.......................................................9图表13:指令跟踪评估(IFEval)基准对比结果............................................9图表14:在各设备上使用Siri从多个应用程序中获取信息...................................10图表15:本周AI初创公司的融资动态.....................................................11图表16:本周指数日涨跌幅..............................................................12图表17:本周AI算力指数内部涨跌幅度排名...............................................12图表18:本周AI应用指数内部涨跌幅度排名...............................................12图表19:重点关注公司及盈利预测........................................................13 1、算 力 动 态 : 算 力 租 赁 价 格 平 稳 ,AMDInstinct产品线更新MI325X同步英伟达 1.1、数据跟踪:算力租赁价格平稳 本周算力租赁价格环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的价格为9.00元/时。 1.2、产业动态:Instinct产品线一年一更同步英伟达,新款MI325X算力峰值较H200快1.3倍 近期,AMD董事长兼CEO苏姿丰在Computex 2024展会的开幕主题演讲中,公布了全新云端AI加速芯片路线图,路线图显示今年将会推出Instinct MI325X,2025年推出MI350,2026年推出MI400,以满足对AI算力日益增长的需求。 图表2:2024-2026年Instinct GPU路线图 资料来源:澎湃新闻,华鑫证券研究 MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s,整体的性能将进一步提升。其他方面的规格基本保持与MI300X一致,其可视为MI300更换HBM3E内存的刷新版本,便于客户的产品升级过渡。AI性能提升幅度为AMD史上最大。MI325X内存大小和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍。 资料来源:澎湃新闻,华鑫证券研究 2025年提前推出MI350X以应对英伟达量产H200。Instinct MI350系列的首款产品MI350X加速器基于CDNA 4架构,预计将于2025年上市。它将使用与其他MI300系列加速器相同的行业标准通用基板服务器设计,并将使用先进的3nm工艺技术构建,支持FP4和FP6 AI数据类型,并拥有高达288 GB的HBM3E内存。在推理性能方面,CDNA 4架构是 CDNA 3的35倍。MI350的内存容量将是英伟达2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。其次,AMD预计将在2026年推出基于CDNA "Next"架构的Instinct MI400加速器系列,一年一更同步英伟达。 资料来源:澎湃新闻,华鑫证券研究 资料来源:澎湃新闻,华