行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI动态汇总20250804：智谱发布GLM-4.5，蚂蚁数科发布金融推理大模型Agentar-Fin-R1

2025-08-06 肖承志,冯昱文中邮证券胡冠群

1. AI重点要闻

1.1 智谱发布GLM-4.5

标志国产大模型技术从参数规模竞赛转向能力整合与智能体应用落地。
以原生融合智能体能力为核心突破点，通过混合专家架构、高参数效率及开源生态策略重新定义通用人工智能的实践路径。
GLM-4.5首次在单一模型中实现推理、编码与智能体能力的原生融合，采用混合专家架构，包含GLM-4.5（3550亿参数）和GLM-4.5-Air（1060亿参数）两个版本。
在涵盖AGI核心能力的12项评测中，GLM-4.5以63.2综合分位列全球第三，超越DeepSeek-R1与Kimi-K2。
智能体能力尤为突出，在网页交互基准BrowseComp中准确率达26.4%，代码修复任务SWE-bench Verified得分64.2。
被定位为“能执行、能调度、能构建系统”的智能地基，可独立完成全栈开发，如生成“谷歌搜索”网页、“B站”模拟器等。
通过全面开源与低价API策略冲击市场，模型权重在Hugging Face与ModelScope采用MIT协议开源，API定价低至输入0.8元/百万tokens。

1.2 蚂蚁数科发布金融推理大模型Agentar-Fin-R1

标志金融垂直领域大模型技术从通用能力向专业化、场景化能力的重大跨越。
基于Qwen3架构研发，以“可靠、可控、可优化”为核心设计理念，通过金融知识体系重构、动态训练算法创新与开源生态建设。
采用双引擎架构设计，Master Builder引擎将业务逻辑转化为可执行代码，Agent Group引擎实现多智能体协同决策。
在FinEval1.0、FinanceIQ等权威金融评测中，Agentar-Fin-R1超越同尺寸开源通用模型及专业金融模型。
核心优势体现在智能体任务执行能力、安全合规性和通用能力保留三方面。
已深度渗透金融核心业务流程，如在信贷领域将小微企业贷款审批时间从3天压缩至15分钟，坏账率下降18%。
通过全面开源策略重塑金融AI竞争格局，开源Agentar-Deepfinance-100K训练数据集与Finova评测基准。

1.3 商汤发布“悟能”具身智能平台

标志AI技术从数字世界向物理世界交互的关键跃迁。
平台以“开悟”世界模型为核心引擎，通过多模态感知、空间计算与硬件生态协同重新定义具身智能的实践范式。
核心技术“开悟”世界模型具备独特的4D真实世界构建能力，可生成多视角视频并保持时空一致性。
在感知层面，可嵌入端侧芯片实现实时物体识别与场景分割，导航能力实现厘米级避障精度。
交互维度的突破尤为显著，平台通过图文交错思维链技术，使机器人能同时处理视觉输入与语言指令。
已展现出跨行业的场景穿透力，在工业和家庭场景中均有应用，如与傅利叶等厂商合作的千万级机器人集群，通过持续回传操作日志优化世界模型。

1.4 京东推出附身智能品牌JoyInside

标志人机交互从功能化向情感化跃迁的关键突破。
平台以京东JoyAI大模型为核心引擎，通过多模态技术融合与开放生态战略重构了智能硬件产业的底层交互逻辑。
构建了"理解-决策-执行"的完整智能闭环，支持系统层搭载主动对话、情绪检测、长期记忆三大模块。
差异化优势体现在对多元场景的深度适配，如家庭场景中的魔法原子四足机器狗，儿童教育领域的心大陆机器人等。
通过"附身智能加速计划"实施技术普惠，提供SDK、硬件盒子、API三种接入方案，降低中小厂商的智能升级门槛。
重构了智能硬件产业的价值链分工，推动产业资源向设计创新与场景挖掘集中。

2. 企业动态

2.1 字节Seed团队推出Seed Diffusion Preview模型

标志离散扩散技术在语言模型领域的重大突破。
以结构化代码生成为实验领域，通过四项核心技术革新实现了每秒2146 tokens的推理速度，较同等规模自回归模型提升5.4倍。
解决了离散扩散模型的归纳偏置冲突问题，在代码修复基准CanItEdit上的pass@1准确率较自回归模型提升4.8%，达到54.3分。
通过同策略学习范式与块级并行扩散采样的协同优化，实现了理论加速到工程落地的跨越。
重构了语言模型的技术路线竞争格局，证明了离散扩散模型不仅能突破自回归架构的串行解码瓶颈，还能通过并行生成特性增强复杂任务处理能力。

2.2 通义千问更新Qwen3-30B-A3B

标志混合专家架构（MoE）在参数效率与性能平衡上的重大突破。
模型总参数量达305亿，包含128个专家网络，但每次推理仅动态激活8个专家（约33亿参数）。
在权威评测中，该模型展现出与规模远超自身的闭源模型抗衡的实力，如数学推理测试AIME25得分61.3，代码生成任务LiveCodeBench v6得分43.2。
通过端到端优化实现了极低部署门槛，在RTX 3090显卡上运行量化版本时，推理速度达214 tokens/秒，显存占用不足8GB。
重构了模型性能与硬件需求的传统关系，开源策略引发连锁反应，通义模型API全球市场份额一周内从7.3%跃升至10.9%。

3. AI行业洞察

3.1 腾讯Robotics X实验室与福田实验室发布具身智能开放平台Tairos

标志中国机器人产业从硬件驱动向“软件定义硬件”范式转型的关键突破。
平台采用类人类神经系统的分层设计，将复杂智能拆解为可自由组合的三大模型模块：多模态感知模型（右脑）、规划大模型（左脑）、感知行动联合模型（小脑）。
平台通过云端仿真环境与工具链的深度整合，破解了具身智能落地的系统工程难题。
腾讯明确将Tairos定位为机器人产业的“安卓系统”，通过开放合作构建生态护城河。
Tairos的发布恰逢全球人形机器人销量突破10万台的市场拐点，其影响已超越技术层面而触及产业范式变革。

4. 技术前沿

4.1 Goedel-Prover-V2：8B参数击败671B的DeepSeek-Prover

Goedel-Prover-V2是由Princeton Language and Intelligence、清华大学、NVIDIA等机构联合研发的开源定理证明系统，代表了当前自动形式化证明生成领域的最先进水平。
核心创新体现在脚手架式数据合成、验证器引导的自我修正以及模型平均技术。
性能表现方面，Goedel-Prover-V2在多个基准测试中刷新记录，其旗舰型号32B模型在MiniF2F测试集上达到88.1%的Pass@32准确率，自我修正模式下进一步提升至90.4%。
技术实现细节显示，自我修正模式通过两轮迭代优化证明质量，在仅增加25%的token消耗（从32K增至40K）的情况下显著提升性能。
与初代Goedel-Prover相比，V2版本在数据合成策略上有显著进化，引入的脚手架式合成能动态构建难度适配的训练样本，使模型证明能力呈现阶梯式提升。

5. 风险提示

以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。

发布时间：2025-08-06 研究所金工周报分析师:肖承志SAC登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC登记编号:S1340124100011Email:fengyuwen@cnpsec.com 智谱发布GLM-4.5，蚂蚁数科发布金融推理大模型Agentar-Fin-R1——AI动态汇总20250804 ⚫智谱发布GLM-4.5 智谱于2025年7月28日正式发布的GLM-4.5系列大模型，标志着国产大模型技术从参数规模竞赛转向能力整合与智能体应用落地的关键转折。该模型以原生融合智能体能力为核心突破点，通过混合专家架构、高参数效率及开源生态策略，重新定义了通用人工智能的实践路径。近期研究报告《基本面因子表现不佳，小盘风格明显— —中邮因子周报20250803》-2025.08.04 ⚫蚂蚁数科发布金融推理大模型Agentar-Fin-R1 《小市值占优，低波反转显著——中邮因子周报20250727》-2025.07.28 蚂蚁数科于2025年7月28日在世界人工智能大会上发布的金融推理大模型Agentar-Fin-R1，标志着金融垂直领域大模型技术从通用能力向专业化、场景化能力的重大跨越。该模型基于Qwen3架构研发，以“可靠、可控、可优化”为核心设计理念，通过金融知识体系重构、动态训练算法创新与开源生态建设，为金融机构提供覆盖全场景的智能中枢解决方案。《微盘股的流动性风险在哪？——微盘股指数周报20250720》-2025.07.21 《大金融表现居前助指数突破，GRU行业轮动调入非银行金融——行业轮动周报20250713》-2025.07.14 ⚫商汤发布“悟能”具身智能平台商汤科技于2025年7月27日在世界人工智能大会（WAIC）上发布的“悟能”具身智能平台，标志着AI技术从数字世界向物理世界交互的关键跃迁。该平台以“开悟”世界模型为核心引擎，通过多模态感知、空间计算与硬件生态协同，重新定义了具身智能的实践范式。《低估值高盈利，基本面表现占优——中邮因子周报20250706》-2025.07.07 《基于宏观经济状态划分的BL模型与ETF实践》-2025.07.01 ⚫京东推出附身智能品牌JoyInside 京东于2025年7月27日在世界人工智能大会（WAIC）上发布的附身智能品牌JoyInside，标志着人机交互从功能化向情感化跃迁的关键突破。该平台以京东JoyAI大模型为核心引擎，通过多模态技术融合与开放生态战略，重构了智能硬件产业的底层交互逻辑。《反转风格显著，小市值回撤——中邮因子周报20250622》-2025.06.23 《关注基本面支撑，高波风格占优——中邮因子周报20250615》-2025.06.16 ⚫风险提示：以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。《结合基本面和量价特征的GRU模型》-2025.06.05 《Claude 4系列发布，谷歌上线编程智能体Jules——AI动态汇总20250526》-2025.05.27 《谷歌发布智能体白皮书，Manus全面开放注册——AI动态汇总20250519》-2025.05.20 目录 1 AI重点要闻..............................................................................41.1智谱发布GLM-4.5.....................................................................41.2蚂蚁数科发布金融推理大模型Agentar-Fin-R1............................................71.3商汤发布“悟能”具身智能平台.........................................................91.4京东推出附身智能品牌JoyInside......................................................112企业动态................................................................................132.1字节Seed团队推出Seed Diffusion Preview模型........................................132.2通义千问更新Qwen3-30B-A3B..........................................................163 AI行业洞察.............................................................................183.1腾讯Robotics X实验室与福田实验室发布具身智能开放平台Tairos.........................184技术前沿................................................................................204.1 Goedel-Prover-V2：8B参数击败671B的DeepSeek-Prover..................................205风险提示................................................................................23 图表目录图表1：GLM-4.5常见基准评测...........................................................4图表2：GLM-4.5智能体任务基准测评.....................................................5图表3：SWE-bench下帕累托前沿分析，GLM-4.5表现更优....................................6图表4：Agentar-Fin-R1架构............................................................7图表5：商汤展示机器人进行PPT汇报.....................................................9图表6：商汤”开悟”世界模型生成逼真的七路摄像头视角模拟数据.............................10图表7：京东JoyInside解决方案全景图..................................................12图表8：Seed Diffusion在代码基准上的表现..............................................14图表9：Seed Diffusion在不同任务上表现优异............................................15图表10：Qwen3-30B-A3B-Instruct-2507跑分..............................................16图表11：Goedel-Prover-V2在多个IMO级别的基准上通过Pass@32性能测试...................21图表12：不同样本预算下MiniF2F测试集上的表现........................................22 1AI重点要闻 1.1智谱发布GLM-4.5 智谱于2025年7月28日正式发布的GLM-4.5系列大模型，标志着国产大模型技术从参数规模竞赛转向能力整合与智能体应用落地的关键转折。该模型以原生融合智能体能力为核心突破点，通过混合专家架构、高参数效率及开源生态策略，重新定义了通用人工智能的实践路径。资料来源：z.ai，中邮证券研究所 GLM-4.5首次在单一模型中实现推理、编码与智能体能力的原生融合，其设计哲学源于对AGI第一性原理的重新诠释——即在保留通用能力的前提下整合专项技能。模型采用混合专家架构，包含两个版本：GLM-4.5总参数量3550亿，单次推理激活参数320亿；GLM-4.5-Air总参数量1060亿，激活参数120亿。这种架构通过动态路由机制仅激活任务相关专家网络，显著提升计算效率。训练流程分为三阶段：先在15万亿通用文本上预训练建立通识基础，再以8万亿代码、推理及智能体专项数据精调，最终通过强化学习对齐多任务能力。值得注意的是，模型采用“深度优先”设计，减少网络宽度而增加层数至96层，配合部分旋转位置编码与分组查询注意力机制，使复杂推理任务的性能提升37%。资料来源：z.ai，中邮证券研究所在涵盖AGI核心能力的12项评测中，GLM-4.5以63.2综合分位列全球第三，超越DeepSeek-R1与Kimi-K2，成为国产与开源模型双料冠军。其智能体能力尤为突出：在网页交互基准BrowseComp中准确率达26.4%，超越Claude-4-Opus的18.8%；代码修复任务SWE-bench Verified得分64.2，工具调用成功率超90%。对比测试显示，GLM-4.5在52个真实编程任务中，对Qwen3-Coder的胜率达80.8%，虽略逊于Claude-4-Sonnet的50%败率，但已实现多数场景平替。这种高效能得益于参数效率优化——其参数量仅为DeepSeek-R1的1/2，却在同等测试中表现更优，形成性能/参数比的帕累托前沿。 GLM-4.5被定位为“能执行、能调度、能构建系统”的智能地基。实际案例显示其可独立完成全栈开发：用户通过自然语言指令生成功能完整的“谷歌搜索”网页、支持弹幕交互的“B站”模拟器及HTML5游戏《Flappy Bird》。在自动化办公场景中，模型能根据关键词自动生成图文混排PPT，串联文案创作、数据检索与多模态调度。这种能力源于128K长上下文支持与原生函数调用设计，使模型可直接调度浏览器、数据库等外部工具，而非依赖后期插件集成。工程部署方面，模型提供双模式运行——思考模式用于复杂任务规划，非思考模式实现100+tokens/秒的即时响应，兼顾深度与效率。资料来源：z.ai，中邮证券研究所 GLM-4.5通过全面开源与低价API策略冲击市场：模型权重在Hugging Face与ModelScope采用MIT协议开源，允许商业二次开发；API定价低至输入0.8元/百万tokens，不足Claude-4-Sonnet的1/10。这种策略迅速引发生态效应，发布12小时内登顶Hugging Face榜单全球第二，被彭博社评价为“中国AI易获取趋势的典范”。智谱CEO张鹏强调，AGI发展需打破能力割裂，而GLM-4.5的实践证明，通过架构创新可将分散的专项能力整合为“全优生”型智能体。尽管在编程任务中仍存在10%的可靠性差距，但其开源属性与真实场景表现，已推动国产模型进入国际竞争核心圈层。从技术史视角看，GLM-4.5的发布不仅是版本迭代，更是AI发展范式的重构。它以原生智能体能力为锚点，将高参数效率、低成本部署与开源生态结合，为工业级应用提供了新地基。随着其生态扩展，这种“能力整合优先于规模扩张”的路径，或将成为全球AGI研发的重要参照系。 1.2蚂蚁数科发布金融推理大模型Agentar-Fin-R1 蚂蚁数科于2025年7

点击免费查看完整报告

AI动态汇总20250804：智谱发布GLM-4.5，蚂蚁数科发布金融推理大模型Agentar-Fin-R1

1. AI重点要闻

1.1 智谱发布GLM-4.5

1.2 蚂蚁数科发布金融推理大模型Agentar-Fin-R1

1.3 商汤发布“悟能”具身智能平台

1.4 京东推出附身智能品牌JoyInside

2. 企业动态

2.1 字节Seed团队推出Seed Diffusion Preview模型

2.2 通义千问更新Qwen3-30B-A3B

3. AI行业洞察

3.1 腾讯Robotics X实验室与福田实验室发布具身智能开放平台Tairos

4. 技术前沿

4.1 Goedel-Prover-V2：8B参数击败671B的DeepSeek-Prover

5. 风险提示

你可能感兴趣

AI动态汇总20250421：OpenAI发布GPT-4.1，智谱发布GLM-4-32B-0414系列

AI动态汇总：AI模型通过标准图灵测试，智谱发布AI Agent AutoGLM沉思

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型

能辉科技光伏反内卷携手蚂蚁数科转型AI机器人东北先进材料石

AI产业跟踪海外：智谱开源GLM-4.5，特斯拉人形机器人再度亮相

计算机行业点评报告：智谱发布GLM-4.7并开源，关注国产AI大模型开源战略进展

AI动态汇总20250818：智元推出机器人世界模型平台genie envesioner，智谱上线GLM-4.5a视觉推理模型

2026春节期间AI行业动态汇总一国内模型与产品发布1智谱AI2

Triton推理引擎专场,面向多框架的AI模型部署服务Triton及其在蚂蚁预测引擎中的应用实践（上）

AI动态汇总：谷歌推出Gemini Robotics On-Device大模型，快手开源keye-VL多模态模型