AI智能总结
Grok3性能优秀,xAI或进一步扩大算力规模。2025年2月18日,xAI发布大模型Grok3,该模型在数学(AIME24)、科学(GPQA)和编码(LCBOct-Feb)三方面,Grok-3大幅超过Gemini-2Pro、DeepSeek-V3、Claude3.5Sonnet和GPT-4o,轻量版本Grok-3mini则与这些可比模型相近。Grok-3支持推理能力,推理表现超越了OpenAIo3mini(high)、DeepSeekR1、谷歌Gemini2FlashThinking等其他推理模型。其思考模式可显示思维过程,“BigBrain”模式可以使用更多算力解决问题,进行更深度思考,深度搜索(DeepSearch)模式可以联网进行更深入搜索。Grok3的优秀性能下有大量算力支撑,其通过位于孟菲斯的包含约20万块GPU的数据中心的进行训练,随着训练项目进入下一阶段,xAI集群规模或将迈向百万卡规模,潜在算力需求巨大。 AI领域开源模型、研究密集发布,AI模型加速进化。2025年2月18日,DeepSeek开源新一代注意力机制NSA(NativeSparseAttention,原生稀疏注意 力),主要用于解决大模型长文本处理中的计算成本高昂的问题。其创新之处在于采用分层的稀疏注意力设计(压缩注意力、选择性注意力、滑动窗口注意力)、硬件友好的实现优化。同一天,阶跃星辰开源两款多模态大模型。这两款大模型分别是视频生成模型Step-Video-T2V和行业内首款产品级开源语音交互模型Step-Audio。根据官方的测评报告,目前Step-Video-T2V是全球范围内参数量最大、性能最好的开源视频生成模型。目前,两款大模型均已可以在「跃问」App上进行体验。 AI竞赛加剧,产业加速发展,而芯片制造目前是中国AI产业主要瓶颈,有望随着产业链成熟逐步突破。各个科技企业的AI模型竞赛加剧,开源生态又加速了AI模型进化速度,也推动AI商业化更快落地,AI产业需求向好。中国与美国的AI模型差距在缩小,但芯片制造领域依然存在差距,是当前AI产业规模化发展的主要瓶颈,目前,中国大陆7nm及以下先进制程产能与台积电等代工厂依然有数量级的差距,未来随着产业链成熟,供应能力有望逐步增强。半导体制造、封测环节的企业有望受益于巨大的国产市场需求,我们建议增持中芯国际、华虹半导体、甬矽电子。 催化剂:关键技术突破、下游需求快速增长。 风险提示:地缘政治风险、AI商业化进展不及预期、技术突破/创新不及预期。 文章来源 本文摘自:2025年2月19日发布的《AI模型加速进化,国产半导体突破在即》舒迪,资格证书编号:S0880521070002 李奇,资格证书编号:S0880523060001钟吉芸,资格证书编号:S0880124060021 更多国君研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明