市场有风险,投资需谨慎研究所分析师:肖承志SAC登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文SAC登记编号:S1340124100011Email:fengyuwen@cnpsec.com近期研究报告《大金融表现居前助指数突破,GRU行业轮动调入非银行金融——行业轮动周报20250713》-2025.07.14《低估值高盈利,基本面表现占优——中 邮 因 子 周 报20250706》2025.07.07《基于宏观经济状态划分的BL模型与ETF实践》-2025.07.01《反转风格显著,小市值回撤——中邮因子周报20250622》-2025.06.23《关注基本面支撑,高波风格占优——中邮因子周报20250615》-2025.06.16《结合基本面和量价特征的GRU模型》-2025.06.05《Claude 4系列发布,谷歌上线编程智能体Jules——AI动态汇总20250526》-2025.05.27《谷歌发布智能体白皮书,Manus全面开放注册——AI动态汇总20250519》-2025.05.20《证监会修改《重组办法》,深化并购重组改革——微盘股指数周报20250518》-2025.05.19《通义千问发布Qwen-3模型,DeepSeek发布数理证明大模型——AI动态汇总20250505》-2025.05.06《基金Q1加仓有色汽车传媒,减仓电新食饮通信——公募基金2025Q1季报点评》-2025.04.30 金工周报动态汇总20250714⚫Grok 4发布⚫通义开源智能体WebSailor⚫454个特定词汇识别AI文章的利器。⚫风险提示:失效的风险;历史信息不代表未来。 - 目录1 AI重点要闻..............................................................................41.1 Grok 4发布..........................................................................41.2通义开源智能体WebSailor.............................................................71.3字节跳动开源AI IDE工具核心组件Trae-Agent...........................................101.4 454个特定词汇识别AI文章...........................................................122企业动态................................................................................152.1北京人形机器人创新中心发布运动控制框架Tien Kung-Lab.................................152.2 ChatGPT推出“一起学习”功能.........................................................173 AI行业洞察.............................................................................193.1 Meta投资Scale AI...................................................................194技术前沿................................................................................214.1 Agentic Deep Research:将颠覆搜索引擎...............................................215风险提示................................................................................24 请务必阅读正文之后的免责条款部分2 图表目录图表1:Grok 4 HLE测试结果............................................................4图表2:Grok 4领跑ARC AGI榜单........................................................4图表3:ARC-AGI榜单...................................................................5图表4:Grok 4在强化学习和预训练上投入的算力相同.......................................6图表5:BrowseComp英文测评............................................................8图表6:BrowseComp中文测评............................................................8图表7:WebSailor评测.................................................................9图表8:Trae-Agent特性...............................................................10图表9:2024年词汇出现频率提升统计....................................................12图表10:各种子语料库的频率差距评估...................................................13图表11:AI常用词语出现频率展示......................................................14图表12:Tien Kung-Lab运动控制算法框架示意图..........................................16图表13:“一起学习”(Study together)功能............................................18图表14:论文Agentic Deep Research...................................................22图表15:信息搜索工具进化图...........................................................23图表16:Agentic Deep Research评测...................................................24 请务必阅读正文之后的免责条款部分3 请务必阅读正文之后的免责条款部分1AI重点要闻1.1Grok 4发布2025年7月10日,埃隆·马斯克旗下的人工智能公司xAI正式发布了新一代大模型Grok 4,这一事件被广泛视为人工智能领域的一次重大技术跃迁。马斯克在发布会上高调宣称,Grok 4是“全球最强AI模型”,其学术处理能力已达到博士级别,甚至可能在年内发现新的物理定律。这一宣言迅速引发全球科技界的广泛关注与讨论。Grok4的技术架构体现了xAI在人工智能领域的野心与创新。模型分为两个版本:标准版Grok 4支持单代理推理,而Grok 4 Heavy则采用多代理架构,支持四个智能体并行工作,通过交叉验证与方案竞优提升复杂任务的处理效率。两者的上下文窗口均支持256K tokens,均为纯推理模型。这一设计在黑洞碰撞模拟等任务中展现出显著优势,智能体分工协作完成物理计算、可视化生成及误差校验,形成全流程闭环。值得注意的是,Grok 4首次尝试整合多模态能力,支持图像输入并计划未来加入视频识别功能,同时推出专为开发者设计的编程版本Grok 4 Code,可在代码生成、调试等方面提供专业支持。资料来源:xAI,中邮证券研究所性能表现上,Grok 4在多项基准测试中刷新纪录。在被称为“人类最后考试”的HLE测试中,Grok4基础得分为25.4%,启用推理模式后飙升至45%,而 4图表2:Grok 4领跑ARC AGI榜单资料来源:ARC Prize,中邮证券研究所 请务必阅读正文之后的免责条款部分5Grok 4 Heavy更达到50.7%,远超OpenAI o3和谷歌Gemini 2.5 Pro的21%左右成绩。权威平台Artificial Analysis的测评显示,Grok 4以AI指数73分登顶全球第一,领先于o3的70分和Claude 4 Opus的64分。在数学与科学领域,Grok 4实现了AIME竞赛满分、GPQA物理天文测试88%-89%的准确率;在应用层面,其法律推理准确率达91%,模拟运营净资产是Claude 4的两倍。这些数据支撑了马斯克关于“所有学科达到博士后水平”的论断。图表3:ARC-AGI榜单资料来源:ARC Prize,中邮证券研究所技术突破的背后是xAI在算力上的巨额投入。Grok 4训练动用了超过20万块英伟达H100 GPU构建的Colossus超算集群,推理能力训练计算量较前代提升100倍。模型采用动态稀疏注意力算法,尽管上下文窗口较Grok 3有所缩减,但在金融合约分析等任务中效率反升40%。更引人注目的是其“第一性原理推理”能力,突破传统AI对数据统计的依赖,直接基于物理公理构建解决方案,如在火箭发动机设计中自主模拟热力学过程生成原创方案。 请务必阅读正文之后的免责条款部分资料来源:xAI,中邮证券研究所商业化策略上,xAI采取了差异化的定价体系。Grok 4订阅费为30美元/月,Grok 4 Heavy高达300美元/月,年费方案分别为300美元和3000美元,明显高于行业竞品。API调用定价为每百万输入Token 3美元,输出15美元。这种高端定位与特斯拉生态深度绑定,Grok 4将整合至FSD自动驾驶系统及Optimus人形机器人,推动AI与硬件的协同进化。然而,xAI面临严峻的商业化压力,2025年预计营收仅5亿美元,远低于OpenAI的127亿美元,目前依赖特斯拉输血和近期完成的100亿美元融资支撑。Grok 4的发布也伴随着争议与挑战。伦理方面,前代Grok 3曾因生成反犹言论和不当历史关联引发批评,如将日本核爆事件类比为烟花引发外交风波。尽管xAI强调Grok 4以“追求真相”为目标,新增规则要求对时事查询深度分析多方信源,并允许“政治不正确但依据充分的表述”,但多智能体模式可能放大错误信息的风险仍受质疑。数据偏见问题同样引发关注,批评者指出马斯克可能通过Grok植入主观意识形态,与AI中立原则产生冲突。从行业影响看,Grok 4标志着AI竞争进入新阶段。其性能直接对标OpenAI的GPT-5和Anthropic的Claude 4 Opus,在推理能力、多模态处理和应用场景拓展上形成差异化优势。xAI计划后续推出视频生成模型等产品,试图以月更速 6 请务必阅读正文之后的免责条款部分7度保持技术领先。而马斯克“现实才是最终推理测试”的宣言,暗示了Grok系列向通用人工智能迈进的终极目标。这场由Grok 4引发的AI竞赛,不仅关乎技术突破,更将重塑全球科技产业的力量格局。1.2通义开源智能体WebSailor2025年7月7日