您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:Grok:xAI引领Agent加速落地 - 发现报告

Grok:xAI引领Agent加速落地

AI智能总结
查看更多
Grok:xAI引领Agent加速落地

计算机2025年09月23日 计算机行业深度研究报告 推荐 (维持) Grok:xAI引领Agent加速落地 ❑Grok:马斯克创立,xAI公司旗下大语言模型。公司核心团队来自业内顶尖机构,曾参与GPT、AlphaStar等项目。Grok系列快速迭代,至2025年7月已发布五个版本:Grok-1、Grok-1.5、Grok-2、Grok-3和Grok-4。Grok-1是开源的纯文本MoE模型,在编码和知识测试中表现出色,优于ChatGPT-3.5。Grok-1.5引入长上下文和图像理解;Grok-2整合实时检索和图像生成,形成多模态闭环,在MATH测试中追平GPT-4o,DocVQA领先;Grok-3显著强化推理能力,在AIME、GPQA等高阶测试及Chatbot Arena中超越GPT-4o、Gemini-2Pro、DeepSeek V3、Claude 3.5等旗舰模型;最新Grok-4上下文窗口翻倍至256K tokens,保留多模态并计划新增语音交互及多智能体推理。 华创证券研究所 证券分析师:吴鸣远邮箱:wumingyuan@hcyjs.com执业编号:S0360523040001 联系人:周志浩邮箱:zhouzhihao1@hcyjs.com ❑Agent:多维Agent助力xAI光速迭代,Grok 4领衔AI学术领域。7月10日,xAI发布Grok-4,宣称其综合性能全球领先,尤其在理工科和编程领域达到博士研究水平。该模型在权威的“人类级考试”中以44.4%准确率刷新纪录,并在AIME数学竞赛、SAT、GRE等传统测试中超越OpenAI o3、Gemini 2.5Pro和Claude 4等顶级模型。Grok-4具备处理超长信息的能力,计算资源投入相比前代巨幅增加,并推出普通版和更强大的会员多智能体协作版“Grok-4Heavy”。它在多场景应用表现出色,如预测体育赛事、生成物理动画、优化商业运营及精准理解社交媒体内容。未来Grok-4将持续优化升级,8月将推出编程专用版本,9月发布多模态智能体版本,10月正式上线视频模型。xAI同时公布了庞大的算力建设蓝图,目标五年内达到相当于5000万块顶级AI芯片的规模以支撑发展。 行业基本数据 %1M6M12M绝对表现6.7%17.4%71.5%相对表现1.3%9.1%50.2% ❑海外大模型引领行业发展,国产大模型多点突破持续追赶。对比分析国内外模型产品,海外方面:OpenAI持续推进GPT-4系列多模态升级,ChatGPT Agent在多项基准测试表现出色,GPT-5已经问世;Anthropic的Claude 4系列在软件编码能力上表现卓越。作为Google旗舰,Gemini 2.5 Pro通过增加深度思考模块、扩展上下文窗口及引入“思维预算”功能。国内方面:截至2025年6月底,我国生成式AI服务与应用备案登记体系规模化落地,累计备案服务439款、登记应用233款。国产模型表现亮眼:Kimi K2性能逼近Claude 4 Opus,在多项评测中领跑国产开源模型,输入成本降至GPT-4.1的三分之一;新版DeepSeek-V3.1通过系统性Post-Training优化,在模型灵活性与推理效率的双重突破,显著提升了工具调用及复杂任务执行性能。DeepSeek-V3.1新版本基于Post-Training优化显著增强Agent能力,大幅提升模型灵活性与思考效率,在工具使用与智能体任务执行上表现突出。;阿里巴巴Qwen3系列持续升级,新推出的Qwen3 Coder编程模型在编码基准测试中媲美Claude Sonnet 4,在中文语义和垂直任务中保持优势。国产大模型在性能、成本效率上突破显著增强了国际竞争力。我们认为:1)全球大模型竞争格局,已由OpenAI一家独大,走向多极竞争格局;2)AI关注应聚焦模型即应用与AI+场景维度。 相关研究报告 《计算机行业周报(20250721-20250725):WAIC盛会,关注国产算力与AI应用机会》2025-07-27《 计 算 机 行 业 周 报 (20250714-20250718):ChatGPT Agent发布,智能体商业化再提速》2025-07-20《计算机行业深度研究报告:字节跳动:深度布局AIGC,竞逐新一轮技术浪潮》2025-07-20 ❑投资建议及相关标的:建议关注AI应用方向: ⚫企业级服务:1)办公:金山办公、合合信息、福昕软件、三六零;2)编程:卓易信息、普元信息;3)ERP:金蝶国际、用友网络;4)OA:泛微网络、致远互联;5)多模态:万兴科技、美图公司、虹软科技、当虹科技;6)营销:迈富时、明源云;7)邮箱:彩讯股份等。 ⚫行业场景:1)金融:大智慧、同花顺、恒生电子、京北方、宇信科技、第四范式、中科金财;2)教育:科大讯飞、视源股份、新开普、佳发教育、鸥玛软件;3)法律:华宇软件、金桥信息;4)医疗:阿里健康、卫宁健康、讯飞医疗科技、晶泰控股;5)电商:焦点科技;6)安全:深信服、三未信安;7)工业:华大九天、中控技术、中望软件、索辰科技、鼎捷数智;8)军用:中科星图、能科科技等。 ❑风险提示:技术进展不及预期;模型落地不及预期;商业落地不及预期。 投资主题 报告亮点 本篇报告详细介绍了由马斯克创办的xAI旗下的大模型Grok的发展历程及其产品技术情况,进一步分析最新发布的Grok-4大模型的情况及其行业地位,并阐述国内外主流大模型厂商目前的商业化进展,进一步阐述由大模型引发的人工智能行业变革。 投资逻辑 聚焦Grok-4技术领先性与国内外大模型产品迭代升级驱动行全产业商业化加速: 1)xAI通过Grok-4在学术级测试和多场景应用建立技术壁垒,其多智能体协作版(Heavy)与五年5000万H100等效算力规划进一步强化生态护城河; 2)国产模型以显著成本效率实现性能追平——Kimi K2输入成本仅为GPT-4.1的1/3且逼近Claude 4,DeepSeek R1推理能力比肩国际旗舰,阿里Qwen3 Coder编码媲美Claude并主导中文垂直场景,结合国内超672款备案应用/服务的商业化加速,高性价比模型厂商及落地场景供应商价值凸显。同时,OpenAI(GPT-5)、Google(Gemini 2.5 Pro)及Anthropic(Claude 4)的持续竞速将催化多模态与Agent赛道扩容,利好全产业链技术升级,共同驱动行业天花板抬升。 随着国际大模型厂商以及国内大模型持续迭代升级,应用端商业化及多模态Agent落地进展将会显著提升。 目录 一、xAI:马斯克旗下人工智能公司,Grok系列的缔造者...............................................5 二、Grok系列:从Grok-1-3前代模型更新与回顾...........................................................6 (一)Grok核心组件更新介绍......................................................................................6(二)Grok系列:从文本模型到多模态的版本升级..................................................61、Grok-1:xAI的大文本模型的开山之作...............................................................62、Grok-1.5 Vision:xAI的首个多模态模型............................................................73、Grok-2实现实时检索与图文闭环驱动的多模态跃迁.........................................84、Grok-3:实现大规模推理与实时在线思考..........................................................8 三、Grok-4:xAI最新多维智能体模型.............................................................................10 (一)高性能测试:Grok-4多模态交互+跨领域博士级表现...................................101、多维Agent算力互助,Grok-4领衔AI学术领域.............................................102、Grok-4实体工具链深度整合,多模态助力场景能力交互提升.......................113、Grok后续更新计划:算力筑基加持视频图文多模态演化..............................13 四、海内外大模型持续迭代升级,多模态场景加速落地.................................................15 (一)海外方面:巨头领衔大模型市场方向.............................................................161、ChatGPT:高性能AI大模型龙头......................................................................162、Claude:专注代码智能,行业编程基准领先....................................................173、Gemini:谷歌旗下全能型多模态大模型...........................................................17 (二)国内方面:大模型多点突破,性价比优势显著.............................................181、DeepSeek:R1多维度测评成绩优异...............................................................192、月之暗面:KimK2综合性能领跑国内大模型..................................................193、通义千问:阿里开源国内最强代码模型...........................................................20 五、投资建议与相关标的.....................................................................................................21 六、风险提示.........................................................................................................................22 图表目录 图表1 xAI初创成员名单......................................................................................................5图表2 Grok系列发布时间表.........................................................................................