行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Grok：xAI引领Agent加速落地

信息技术 2025-09-23 华创证券 Daisy.Aldrich

核心观点

xAI与Grok系列：由马斯克创立的xAI公司致力于发展Grok系列大语言模型，该系列经历了从Grok-1到Grok-4的快速迭代，在性能和功能上不断提升。
Grok系列发展历程：
- Grok-1：开源的纯文本MoE模型，在编码和知识测试中表现出色，优于ChatGPT-3.5。
- Grok-1.5：引入长上下文和图像理解功能。
- Grok-2：整合实时检索和图像生成，形成多模态闭环，在MATH测试中追平GPT-4o。
- Grok-3：显著强化推理能力，在AIME、GPQA等高阶测试及Chatbot Arena中超越GPT-4o等旗舰模型。
- Grok-4：上下文窗口翻倍至256K tokens，保留多模态并计划新增语音交互及多智能体推理。
Agent技术：xAI通过多维Agent助力xAI光速迭代，Grok 4领衔AI学术领域，在学术级测试和多场景应用中建立技术壁垒。
国内外大模型竞争格局：全球大模型竞争格局已由OpenAI一家独大，走向多极竞争格局，AI关注应聚焦模型即应用与AI+场景维度。
国产大模型发展：国产模型在性能、成本效率上突破显著增强了国际竞争力，Kimi K2、DeepSeek-V3.1、阿里Qwen3 Coder等模型表现亮眼。

关键数据

Grok系列模型上下文窗口容量：Grok-1为8000 tokens，Grok-2提升至128000 tokens，Grok-4翻倍至256000 tokens。
Grok-4 HLE测试准确率：44.4%，刷新纪录。
Kimi K2输入成本：GPT-4.1的三分之一。
DeepSeek-V3.1成本：缓存命中时成本仅0.5元/百万Tokens。
xAI未来算力目标：五年内达到相当于5000万块英伟达H100 Tensor Core GPU的算力规模。

研究结论

xAI通过Grok-4在学术级测试和多场景应用建立技术壁垒，其多智能体协作版（Heavy）与五年5000万H100等效算力规划进一步强化生态护城河。
国产模型以显著成本效率实现性能追平，高性价比模型厂商及落地场景供应商价值凸显。
随着国际大模型厂商以及国内大模型持续迭代升级，应用端商业化及多模态Agent落地进展将会显著提升。

计算机2025年09月23日计算机行业深度研究报告推荐（维持） Grok：xAI引领Agent加速落地 ❑Grok：马斯克创立，xAI公司旗下大语言模型。公司核心团队来自业内顶尖机构，曾参与GPT、AlphaStar等项目。Grok系列快速迭代，至2025年7月已发布五个版本：Grok-1、Grok-1.5、Grok-2、Grok-3和Grok-4。Grok-1是开源的纯文本MoE模型，在编码和知识测试中表现出色，优于ChatGPT-3.5。Grok-1.5引入长上下文和图像理解；Grok-2整合实时检索和图像生成，形成多模态闭环，在MATH测试中追平GPT-4o，DocVQA领先；Grok-3显著强化推理能力，在AIME、GPQA等高阶测试及Chatbot Arena中超越GPT-4o、Gemini-2Pro、DeepSeek V3、Claude 3.5等旗舰模型；最新Grok-4上下文窗口翻倍至256K tokens，保留多模态并计划新增语音交互及多智能体推理。华创证券研究所证券分析师：吴鸣远邮箱：wumingyuan@hcyjs.com执业编号：S0360523040001 联系人：周志浩邮箱：zhouzhihao1@hcyjs.com ❑Agent：多维Agent助力xAI光速迭代，Grok 4领衔AI学术领域。7月10日，xAI发布Grok-4，宣称其综合性能全球领先，尤其在理工科和编程领域达到博士研究水平。该模型在权威的“人类级考试”中以44.4%准确率刷新纪录，并在AIME数学竞赛、SAT、GRE等传统测试中超越OpenAI o3、Gemini 2.5Pro和Claude 4等顶级模型。Grok-4具备处理超长信息的能力，计算资源投入相比前代巨幅增加，并推出普通版和更强大的会员多智能体协作版“Grok-4Heavy”。它在多场景应用表现出色，如预测体育赛事、生成物理动画、优化商业运营及精准理解社交媒体内容。未来Grok-4将持续优化升级，8月将推出编程专用版本，9月发布多模态智能体版本，10月正式上线视频模型。xAI同时公布了庞大的算力建设蓝图，目标五年内达到相当于5000万块顶级AI芯片的规模以支撑发展。行业基本数据 %1M6M12M绝对表现6.7%17.4%71.5%相对表现1.3%9.1%50.2% ❑海外大模型引领行业发展，国产大模型多点突破持续追赶。对比分析国内外模型产品，海外方面：OpenAI持续推进GPT-4系列多模态升级，ChatGPT Agent在多项基准测试表现出色，GPT-5已经问世；Anthropic的Claude 4系列在软件编码能力上表现卓越。作为Google旗舰，Gemini 2.5 Pro通过增加深度思考模块、扩展上下文窗口及引入“思维预算”功能。国内方面：截至2025年6月底，我国生成式AI服务与应用备案登记体系规模化落地，累计备案服务439款、登记应用233款。国产模型表现亮眼：Kimi K2性能逼近Claude 4 Opus，在多项评测中领跑国产开源模型，输入成本降至GPT-4.1的三分之一；新版DeepSeek-V3.1通过系统性Post-Training优化，在模型灵活性与推理效率的双重突破，显著提升了工具调用及复杂任务执行性能。DeepSeek-V3.1新版本基于Post-Training优化显著增强Agent能力，大幅提升模型灵活性与思考效率，在工具使用与智能体任务执行上表现突出。；阿里巴巴Qwen3系列持续升级，新推出的Qwen3 Coder编程模型在编码基准测试中媲美Claude Sonnet 4，在中文语义和垂直任务中保持优势。国产大模型在性能、成本效率上突破显著增强了国际竞争力。我们认为：1）全球大模型竞争格局，已由OpenAI一家独大，走向多极竞争格局；2）AI关注应聚焦模型即应用与AI+场景维度。相关研究报告《计算机行业周报（20250721-20250725）：WAIC盛会，关注国产算力与AI应用机会》2025-07-27《计算机行业周报（20250714-20250718）：ChatGPT Agent发布，智能体商业化再提速》2025-07-20《计算机行业深度研究报告：字节跳动：深度布局AIGC，竞逐新一轮技术浪潮》2025-07-20 ❑投资建议及相关标的：建议关注AI应用方向： ⚫企业级服务：1）办公：金山办公、合合信息、福昕软件、三六零；2）编程：卓易信息、普元信息；3）ERP：金蝶国际、用友网络；4）OA：泛微网络、致远互联；5）多模态：万兴科技、美图公司、虹软科技、当虹科技；6）营销：迈富时、明源云；7）邮箱：彩讯股份等。 ⚫行业场景：1）金融：大智慧、同花顺、恒生电子、京北方、宇信科技、第四范式、中科金财；2）教育：科大讯飞、视源股份、新开普、佳发教育、鸥玛软件；3）法律：华宇软件、金桥信息；4）医疗：阿里健康、卫宁健康、讯飞医疗科技、晶泰控股；5）电商：焦点科技；6）安全：深信服、三未信安；7）工业：华大九天、中控技术、中望软件、索辰科技、鼎捷数智；8）军用：中科星图、能科科技等。 ❑风险提示：技术进展不及预期；模型落地不及预期；商业落地不及预期。投资主题报告亮点本篇报告详细介绍了由马斯克创办的xAI旗下的大模型Grok的发展历程及其产品技术情况，进一步分析最新发布的Grok-4大模型的情况及其行业地位，并阐述国内外主流大模型厂商目前的商业化进展，进一步阐述由大模型引发的人工智能行业变革。投资逻辑聚焦Grok-4技术领先性与国内外大模型产品迭代升级驱动行全产业商业化加速： 1）xAI通过Grok-4在学术级测试和多场景应用建立技术壁垒，其多智能体协作版（Heavy）与五年5000万H100等效算力规划进一步强化生态护城河； 2）国产模型以显著成本效率实现性能追平——Kimi K2输入成本仅为GPT-4.1的1/3且逼近Claude 4，DeepSeek R1推理能力比肩国际旗舰，阿里Qwen3 Coder编码媲美Claude并主导中文垂直场景，结合国内超672款备案应用/服务的商业化加速，高性价比模型厂商及落地场景供应商价值凸显。同时，OpenAI（GPT-5）、Google（Gemini 2.5 Pro）及Anthropic（Claude 4）的持续竞速将催化多模态与Agent赛道扩容，利好全产业链技术升级，共同驱动行业天花板抬升。随着国际大模型厂商以及国内大模型持续迭代升级，应用端商业化及多模态Agent落地进展将会显著提升。目录一、xAI：马斯克旗下人工智能公司，Grok系列的缔造者...............................................5 二、Grok系列：从Grok-1-3前代模型更新与回顾...........................................................6 （一）Grok核心组件更新介绍......................................................................................6（二）Grok系列：从文本模型到多模态的版本升级..................................................61、Grok-1：xAI的大文本模型的开山之作...............................................................62、Grok-1.5 Vision：xAI的首个多模态模型............................................................73、Grok-2实现实时检索与图文闭环驱动的多模态跃迁.........................................84、Grok-3：实现大规模推理与实时在线思考..........................................................8 三、Grok-4：xAI最新多维智能体模型.............................................................................10 （一）高性能测试：Grok-4多模态交互+跨领域博士级表现...................................101、多维Agent算力互助，Grok-4领衔AI学术领域.............................................102、Grok-4实体工具链深度整合，多模态助力场景能力交互提升.......................113、Grok后续更新计划：算力筑基加持视频图文多模态演化..............................13 四、海内外大模型持续迭代升级，多模态场景加速落地.................................................15 （一）海外方面：巨头领衔大模型市场方向.............................................................161、ChatGPT：高性能AI大模型龙头......................................................................162、Claude：专注代码智能，行业编程基准领先....................................................173、Gemini：谷歌旗下全能型多模态大模型...........................................................17 （二）国内方面：大模型多点突破，性价比优势显著.............................................181、DeepSeek：R1多维度测评成绩优异...............................................................192、月之暗面：KimK2综合性能领跑国内大模型..................................................193、通义千问：阿里开源国内最强代码模型...........................................................20 五、投资建议与相关标的.....................................................................................................21 六、风险提示.........................................................................................................................22 图表目录图表1 xAI初创成员名单......................................................................................................5图表2 Grok系列发布时间表.........................................................................................

点击免费查看完整报告

Grok：xAI引领Agent加速落地

核心观点

关键数据

研究结论

你可能感兴趣

计算机行业周报（20250707-20250711）：Grok4发布：xAI引领Agent加速落地

电子行业先进科技主题周报-周观点：马斯克xAI公司将推出Grok聊天机器人应用，英伟达发布新AI硬件

传播文化业：4月147款国产游戏版号获批，xAI发布Grok 4.3

电子行业事项点评：DeepSeek发布NSA，马斯克旗下XAI发布GroK 3

长江电新AI缺电光储xAI等科技巨头签署自主供电承诺有望加速订单落地

2024年中国AI Agent行业研究-智能体落地千行百业-引领智能化革命的新引擎（摘要版）

2024年中国AI Agent行业研究：智能体落地千行百业，引领智能化革命的新引擎（摘要版）

传媒行业AI产品测评体验系列报告：Manus+AI，通用型AI助手Manus发布，Agent赛道加速落地

行业周报：DeepSeek/OpenAI或加速Agent/多模态、端侧AI落地

TMT行业周报（4月第4周）：MCP协议有望加速Agent产品落地