Grok 4发布,Scaling Law延续 马斯克旗下xAI发布Grok 4,大模型能力前沿持续推进。2025年7月9日,马斯克旗下AI公司xAI发布Grok 4模型。Grok4模型参数量约为1000-1750亿,与竞争者相比,Grok 4在推理能力基准测试中拥有更优表现(35%-45%),拥有更长的上下文窗口、以及更高的参数效率。该模型性能优越但定价不菲,彰显出xAI对其能力的信心。我们认为,Grok 4的发布表明了大语言模型能力前沿的持续推进。伴随着xAI未来的模型发布计划,AI产业落地有望进一步推进。 增持(维持) ScalingLaw延续,算力依旧为大模型进步基石。Grok 4的训练是在超过20万张H100 GPU的超级计算机集群上完成的,是Grok 3时期的两倍。xAI改变了训练策略,将更多的算力投入到“推理能力”的专项训练上。相比于Grok 2,Grok4的训练量提升了整整100倍。xAI官方表示将继续将强化学习扩展到前所未有的水平,以Grok 4的进步为基础,突破AI智能的界限。我们认为,Grok4的能力提升表明了Scaling Law依然有效,扩大训练算力对模型能力的提升依然起到至关重要作用。 Agent成为AI新增长引擎,三大要素:数据、模型、接口。我们认为Agent的三大核心要素包括数据、模型和接口1)垂类数据是Agent能力拓展到各行业的关键,如飞猪的Agent“问一问”接入了自己的机票报价引擎,平台积累的用户评价数据也被深度整合进推荐算法。2)更强大的基础模型使Agent能够处理更复杂的多步骤任务规划,模型的上下文理解能力也对Agent准确识别任务需求与工具的匹配关系至关重要。3)Agent需要通过各类接口与外部系统交互,获取上下文或执行操作,也即使用工具扩展Agent能力。MCP协议的普及进一步降低模型打通各数据源和工具接口的开发成本。 作者 分析师刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 分析师陈泽青执业证书编号:S0680523100001邮箱:chenzeqing3655@gszq.com 相关研究 1、《计算机:全球AI持续景气》2025-07-062、《计算机:重要虚拟资产牌照获批,金融创新加速落地》2025-06-303、《计算机:预训练与推理需求持续旺盛》2025-06-29 建议关注: 算力:寒武纪、海光信息、阿里巴巴、协创数据、有方科技、奥飞数据、沪电股份、新易盛、东阳光、胜宏科技、中际旭创、云赛智联、潍柴重机、科华数据、禾盛新材、伟仕佳杰、浙数文化、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、利通电子、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份。 Agent:阿里巴巴、腾讯控股、金山办公、美图公司、金蝶国际、金桥信息、税友股份、泛微网络、鼎捷数智、拓尔思、朗新集团、用友网络、慧辰股份、宇信科技、京北方、中科金财、麦迪科技、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、海天瑞声、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等军工AI:能科科技、品高股份、普天科技、海格通信等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 内容目录 马斯克旗下xAI发布Grok 4,大模型能力前沿持续推进.........................................................................................3Scaling Law延续,算力依旧为大模型进步基石.....................................................................................................6Agent成为AI新增长引擎,三大要素:数据、模型、接口.....................................................................................7建议关注............................................................................................................................................................9风险提示............................................................................................................................................................9 图表目录 图表1:Grok 4模型发布..................................................................................................................................3图表2:Grok 4的功能特征................................................................................................................................4图表3:Grok 4与竞争者的性能对比...................................................................................................................4图表4:用户调用Agent完成任务的过程............................................................................................................7图表5:MCP架构示意图...................................................................................................................................8 马斯克旗下xAI发布Grok 4,大模型能力前沿持续推进 马斯克旗下xAI发布Grok 4,是Grok系列模型的最新版本。Grok4是由埃隆·马斯克的AI公司xAI开发的大型语言模型的最新版本。它于2025年7月9日正式发布,并通过xAI的官方X账号在太平洋时间晚上8点进行了直播活动。以罗伯特·A·海因莱因在《异乡人》中的概念命名,Grok4代表了显著的进步,跳过了先前预期的Grok3.5版本,以适应在激烈的AI竞争中的加速发展。 资料来源:grok 4官网,国盛证券研究所 从功能上而言,Grok4与前代模型的改进与差别主要如下: ⚫Grok4代码版:一种专门的““Grok4代码”变体,提供智能代码补全、调试辅助和优化建议,使其成为一个强大的编码伙伴,并具有实时IDE集成功能。⚫多模态支持:与之前版本不同,Grok4支持多种输入类型,如文本、图像,甚至可能是视频,使其更接近GPT-4o和Gemini1.5等竞争对手。⚫第一性原理推理:增强的自然语言理解,专注于第一性原理推理,并使用高级逻辑一致性来处理复杂的数学和科学查询。 资料来源:grok 4官网,国盛证券研究所 与竞争者相比,Grok 4在推理能力基准测试中拥有更优表现,拥有更长的上下文窗口、以及更高的参数效率。根据官方对比数据可知,Grok4模型在推理能力Benchmark测试中获得了35%-45%的更优表现。Grok4模型参数量约为1000-1750亿,小于GPT4,根据柱状图信息显示,相比GPT4和Claude3.7,Grok4拥有更高的参数效率以及更长的上下文窗口。 资料来源:grok 4官网,国盛证券研究所 Grok 4性能优越但定价不菲,这一价格彰显出xAI对其能力的信心。根据第三方AI能力测评网站Artificial Analysis对Grok 4的分析,该模型: ⚫智能:与平均水平相比,Grok4的质量更高,MMLU得分为0.866,智能指数在各项评估中为73。⚫价格:Grok4的价格比平均水平高,每1M个Token的价格为6.00美元(混合3:1)。Grok4输入Token价格:$3.00,输出Token价格:$15.00/1M个Token。⚫速度:Grok4的速度比平均水平慢,输出速度为每秒74.7个Token。⚫延迟:与平均水平相比,Grok4的延迟更高,接收第一个token(TTFT)需要6.41秒。 我们认为,Grok 4的发布彰显了xAI模型能力的持续提升,以及大语言模型能力前沿的持续推进。伴随着xAI未来的模型发布计划,AI产业落地有望进一步推进。 Scaling Law延续,算力依旧为大模型进步基石 据经济观察网,Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的,是Grok 3时期的两倍。更重要的是,xAI改变了训练策略,将更多的算力投入到“推理能力”的专项训练上。相比于Grok 2,Grok 4的训练量提升了整整100倍。此前在2024年6月,xAI宣布在美国田纳西州孟菲斯建造超级计算机以训练其人工智能大模型Grok。该系统初期配备20万个英伟达GPU,马斯克计划将GPU规模最终扩大到100万个,而xAI计划今年8月推出代码模型,9月上线多模态智能代理,10月发布视频生成模型。 xAI官方表示将继续将强化学习扩展到前所未有的水平,以Grok 4的进步为基础,突破AI智能的界限。xAI计划将范围从受控域中的可验证奖励扩展到解决复杂的现实世界问题,其中模型可以在动态环境中学习和适应。多模态功能将不断改进,集成视觉、音频等功能,以实现更直观的交互。xAI的重点仍然是使模型更智能、更快、更高效,推动系统真正理解和以深刻的方式帮助人类。 我们认为,Grok4的能力提升表明了Scaling Law依然有效,扩大训练算力对模型能力的提升依然起到至关重要作用。 Agent成为AI新增长引擎,三大要素:数据、模型、接口 随着AI技术的不断迭代,Agent已成为AI产业全新的增长引擎,不同于简单的聊天机器人,Agent能够自主理解复杂目标、拆解任务、调用工具并执行多步骤流程,驱动各行业加速对AI的采用,助推大模型的用量进入新一轮增长。我们认为Agent的三大核心要素包括数据、模型和接口。 资料来源:国盛证券研究所 1、垂类数据是Agent能力拓展到各行业的关键: 当Agent发展进入深耕各行业阶段,垂类数据成为提升Agent性能的核心要素。例如飞猪的Agent““问一问”之所以能解决传统旅游AI的幻觉与时效性痛点,关键在于开放协议接口+实时数据+多智能体协作。飞猪技术负责人倪生华在硅星人pro的采访中表示,“问一问”的训练思路是,让模型学会旅游服务的思考方式后,通过飞猪自有的协议接口和Agent去调用各个场景中的实时数据。 与上一代旅行AI产品依赖静态数据库不同,飞猪直接接入了自己的机票报价引擎