行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI动态汇总20250714：Grok4发布，通义开源智能体websAIlor

2025-07-16 肖承志,冯昱文中邮证券 silence @^^@💗

AI重点要闻
- Grok 4发布：xAI发布新一代大模型Grok 4，宣称其学术处理能力达到博士级别，并在多项基准测试中刷新纪录。Grok 4分为标准版和Grok 4 Heavy版，支持单代理和多代理架构，并首次尝试整合多模态能力。xAI对Grok 4采取了高端定价策略，并将其整合至FSD自动驾驶系统及Optimus人形机器人。
- 通义开源智能体WebSailor：阿里巴巴通义实验室开源WebSailor网络智能体，其在复杂信息检索任务上逼近闭源系统能力，解决了开源生态长期存在的系统性推理能力短板。WebSailor采用"知识图谱随机游走"技术和DUPO强化学习算法，在OpenAI设计的"地狱级"评测集BrowseComp上取得历史性跨越。
- 字节跳动开源AI IDE工具核心组件Trae-Agent：字节跳动开源AI原生集成开发环境Trae的核心组件Trae-Agent，实现了从代码补全到全流程自治跨越的AI编程工具。Trae-Agent采用分层模块化设计，支持多模型切换和动态任务分解，并具备全链路审计追踪能力。
- 454个特定词汇识别AI文章：研究发现，2024年生物医学摘要中出现454个超额词汇，其中379个属于风格词，与以往由重大事件引发的名词主导型词汇变化形成鲜明对比。计算生物学、生物信息学等领域的LLM使用率下限达20%，显著高于传统实验学科。
企业动态
- 北京人形机器人创新中心发布运动控制框架Tien Kung-Lab：北京人形机器人创新中心发布开源运动控制框架Tien Kung-Lab，填补了高性能人形机器人运动控制框架在开源领域的空白。Tien Kung-Lab采用Adversarial Motion Prior风格化奖励机制，支持步态奖励函数、光线追踪技术和Sim2Sim交叉验证，使搭载该框架的天工Ultra机器人能在全球首届人形机器人马拉松比赛中取得优异成绩。
- ChatGPT推出“一起学习”功能：OpenAI在ChatGPT中推出"一起学习"功能，通过苏格拉底式对话引导用户自主思考，推动用户逐步构建知识体系。该功能借鉴了谷歌LearnLM的设计逻辑，并进行了更深度的交互优化，在教育场景中展现出革新性。
AI行业洞察
- Meta投资Scale AI：Meta对Scale AI进行143亿美元的战略投资，获得其49%的无投票权股份，并揭示了AI竞赛中数据基础设施的战略价值。Scale AI作为全球最大的AI数据基础设施提供商，掌握着OpenAI、Google等竞争对手的训练数据命脉。Meta通过此次投资获得高质量训练数据管道、军方级模型评估能力和Alexandr Wang团队在数据工程领域的十年积累。
技术前沿
- Agentic Deep Research：论文《From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents》提出了"智能深度研究"这一信息检索新范式，认为具备推理能力的语言大模型（LLMs）正在颠覆传统关键词搜索模式。智能深度研究通过将自主推理、迭代检索和信息整合融入动态反馈循环，开创信息获取的新时代。
风险提示

以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。

市场有风险，投资需谨慎研究所分析师:肖承志SAC登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文SAC登记编号:S1340124100011Email:fengyuwen@cnpsec.com近期研究报告《大金融表现居前助指数突破，GRU行业轮动调入非银行金融——行业轮动周报20250713》-2025.07.14《低估值高盈利，基本面表现占优——中邮因子周报20250706》2025.07.07《基于宏观经济状态划分的BL模型与ETF实践》-2025.07.01《反转风格显著，小市值回撤——中邮因子周报20250622》-2025.06.23《关注基本面支撑，高波风格占优——中邮因子周报20250615》-2025.06.16《结合基本面和量价特征的GRU模型》-2025.06.05《Claude 4系列发布，谷歌上线编程智能体Jules——AI动态汇总20250526》-2025.05.27《谷歌发布智能体白皮书，Manus全面开放注册——AI动态汇总20250519》-2025.05.20《证监会修改《重组办法》，深化并购重组改革——微盘股指数周报20250518》-2025.05.19《通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型——AI动态汇总20250505》-2025.05.06《基金Q1加仓有色汽车传媒，减仓电新食饮通信——公募基金2025Q1季报点评》-2025.04.30 金工周报动态汇总20250714⚫Grok 4发布⚫通义开源智能体WebSailor⚫454个特定词汇识别AI文章的利器。⚫风险提示：失效的风险；历史信息不代表未来。 - 目录1 AI重点要闻..............................................................................41.1 Grok 4发布..........................................................................41.2通义开源智能体WebSailor.............................................................71.3字节跳动开源AI IDE工具核心组件Trae-Agent...........................................101.4 454个特定词汇识别AI文章...........................................................122企业动态................................................................................152.1北京人形机器人创新中心发布运动控制框架Tien Kung-Lab.................................152.2 ChatGPT推出“一起学习”功能.........................................................173 AI行业洞察.............................................................................193.1 Meta投资Scale AI...................................................................194技术前沿................................................................................214.1 Agentic Deep Research：将颠覆搜索引擎...............................................215风险提示................................................................................24 请务必阅读正文之后的免责条款部分2 图表目录图表1：Grok 4 HLE测试结果............................................................4图表2：Grok 4领跑ARC AGI榜单........................................................4图表3：ARC-AGI榜单...................................................................5图表4：Grok 4在强化学习和预训练上投入的算力相同.......................................6图表5：BrowseComp英文测评............................................................8图表6：BrowseComp中文测评............................................................8图表7：WebSailor评测.................................................................9图表8：Trae-Agent特性...............................................................10图表9：2024年词汇出现频率提升统计....................................................12图表10：各种子语料库的频率差距评估...................................................13图表11：AI常用词语出现频率展示......................................................14图表12：Tien Kung-Lab运动控制算法框架示意图..........................................16图表13：“一起学习”（Study together）功能............................................18图表14：论文Agentic Deep Research...................................................22图表15：信息搜索工具进化图...........................................................23图表16：Agentic Deep Research评测...................................................24 请务必阅读正文之后的免责条款部分3 请务必阅读正文之后的免责条款部分1AI重点要闻1.1Grok 4发布2025年7月10日，埃隆·马斯克旗下的人工智能公司xAI正式发布了新一代大模型Grok 4，这一事件被广泛视为人工智能领域的一次重大技术跃迁。马斯克在发布会上高调宣称，Grok 4是“全球最强AI模型”，其学术处理能力已达到博士级别，甚至可能在年内发现新的物理定律。这一宣言迅速引发全球科技界的广泛关注与讨论。Grok4的技术架构体现了xAI在人工智能领域的野心与创新。模型分为两个版本：标准版Grok 4支持单代理推理，而Grok 4 Heavy则采用多代理架构，支持四个智能体并行工作，通过交叉验证与方案竞优提升复杂任务的处理效率。两者的上下文窗口均支持256K tokens，均为纯推理模型。这一设计在黑洞碰撞模拟等任务中展现出显著优势，智能体分工协作完成物理计算、可视化生成及误差校验，形成全流程闭环。值得注意的是，Grok 4首次尝试整合多模态能力，支持图像输入并计划未来加入视频识别功能，同时推出专为开发者设计的编程版本Grok 4 Code，可在代码生成、调试等方面提供专业支持。资料来源：xAI，中邮证券研究所性能表现上，Grok 4在多项基准测试中刷新纪录。在被称为“人类最后考试”的HLE测试中，Grok4基础得分为25.4%，启用推理模式后飙升至45%，而 4图表2：Grok 4领跑ARC AGI榜单资料来源：ARC Prize，中邮证券研究所请务必阅读正文之后的免责条款部分5Grok 4 Heavy更达到50.7%，远超OpenAI o3和谷歌Gemini 2.5 Pro的21%左右成绩。权威平台Artificial Analysis的测评显示，Grok 4以AI指数73分登顶全球第一，领先于o3的70分和Claude 4 Opus的64分。在数学与科学领域，Grok 4实现了AIME竞赛满分、GPQA物理天文测试88%-89%的准确率；在应用层面，其法律推理准确率达91%，模拟运营净资产是Claude 4的两倍。这些数据支撑了马斯克关于“所有学科达到博士后水平”的论断。图表3：ARC-AGI榜单资料来源：ARC Prize，中邮证券研究所技术突破的背后是xAI在算力上的巨额投入。Grok 4训练动用了超过20万块英伟达H100 GPU构建的Colossus超算集群，推理能力训练计算量较前代提升100倍。模型采用动态稀疏注意力算法，尽管上下文窗口较Grok 3有所缩减，但在金融合约分析等任务中效率反升40%。更引人注目的是其“第一性原理推理”能力，突破传统AI对数据统计的依赖，直接基于物理公理构建解决方案，如在火箭发动机设计中自主模拟热力学过程生成原创方案。请务必阅读正文之后的免责条款部分资料来源：xAI，中邮证券研究所商业化策略上，xAI采取了差异化的定价体系。Grok 4订阅费为30美元/月，Grok 4 Heavy高达300美元/月，年费方案分别为300美元和3000美元，明显高于行业竞品。API调用定价为每百万输入Token 3美元，输出15美元。这种高端定位与特斯拉生态深度绑定，Grok 4将整合至FSD自动驾驶系统及Optimus人形机器人，推动AI与硬件的协同进化。然而，xAI面临严峻的商业化压力，2025年预计营收仅5亿美元，远低于OpenAI的127亿美元，目前依赖特斯拉输血和近期完成的100亿美元融资支撑。Grok 4的发布也伴随着争议与挑战。伦理方面，前代Grok 3曾因生成反犹言论和不当历史关联引发批评，如将日本核爆事件类比为烟花引发外交风波。尽管xAI强调Grok 4以“追求真相”为目标，新增规则要求对时事查询深度分析多方信源，并允许“政治不正确但依据充分的表述”，但多智能体模式可能放大错误信息的风险仍受质疑。数据偏见问题同样引发关注，批评者指出马斯克可能通过Grok植入主观意识形态，与AI中立原则产生冲突。从行业影响看，Grok 4标志着AI竞争进入新阶段。其性能直接对标OpenAI的GPT-5和Anthropic的Claude 4 Opus，在推理能力、多模态处理和应用场景拓展上形成差异化优势。xAI计划后续推出视频生成模型等产品，试图以月更速 6 请务必阅读正文之后的免责条款部分7度保持技术领先。而马斯克“现实才是最终推理测试”的宣言，暗示了Grok系列向通用人工智能迈进的终极目标。这场由Grok 4引发的AI竞赛，不仅关乎技术突破，更将重塑全球科技产业的力量格局。1.2通义开源智能体WebSailor2025年7月7日

点击免费查看完整报告

AI动态汇总20250714：Grok4发布，通义开源智能体websAIlor

你可能感兴趣

Grok 4 发布，通义开源智能体 WebSailor——AI 动态汇总 20250714

金工周报：AI动态汇总-DeepSeek-R1完成小版本更新，阿里开源自主搜索AI智能体

AI动态汇总：Claude 4系列发布，谷歌上线编程智能体Jules

AI动态汇总20250519：谷歌发布智能体白皮书，Manus全面开放注册

AI动态汇总：OpenAI发布搭建智能体新工具，谷歌发布轻量级模型Gemma 3

人工智能周报（25年第26周）：谷歌发布开源 AI智能体 Gemini CLI，MiniMax推出多项新技术及产品

AI动态汇总：Anthropic公开多智能体构建全流程，MiniMax推出推理模型M1

AI动态汇总：上交AI智能体表现亮眼，AlphaEvolve生成代码反超人类20250707

阿里通义发布并开源Qwen3模型

AI动态汇总20250901：苹果推出Xcode26Beta7，英伟达开源Jet-Nemotron高性能语言模型