行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI 动态汇总 20250721：Kimi K2 发布，秘塔发布国内首个免费 Deep Research

2025-07-24 肖承志,冯昱文中邮证券杨春

AI重点要闻
- Kimi K2发布：北京月之暗面科技有限公司推出新一代混合专家架构基础模型，参数规模达1万亿，但每次推理仅激活32B参数，性能表现优异，在多项基准测试中刷新纪录，尤其在自主编程、工具调用和数学推理方面表现出色。
- 秘塔发布Deep Research：秘塔AI推出国内首个免费Deep Research功能，通过分段强化学习策略降低资源消耗，支持多模态报告生成，在中文互联网环境检索与推理表现突出。
- 智源开源RoboBrain 2.0 32B：智源研究院开源具身智能模型RoboBrain 2.0 32B和RoboOS 2.0单机版，突破空间理解、时间建模和长链推理能力瓶颈，推动具身智能从单机智能向群体智能跨越。
- LG推出EXAONE 4.0：LG集团旗下AI研究所发布韩国首个混合推理模型EXAONE 4.0，整合符号推理与神经网络技术，构建双模式架构，在知识推理、数学能力和编程测试中展现卓越能力。
企业动态
- OpenAI发布ChatGPT智能体：OpenAI发布ChatGPT智能体，融合Operator、Deep Research和ChatGPT技术，具备自主思考与行动能力，在跨学科测试、数据分析和电子表格处理任务中表现优异。
- 谷歌发布T5Gemma模型：谷歌推出T5Gemma模型系列，采用编码器-解码器架构，通过“适应”技术实现灵活的模型配置，在质量与效率平衡方面表现突出，专精于文本生成类任务。
AI行业洞察
- 《AI智能体运行安全测试标准》发布：世界数字科学院联合多家机构发布《AI智能体运行安全测试标准》，构建全链路风险分析框架，引入动态环境下的网络通信分析技术，推动AI治理从理论探讨迈入标准化实施阶段。
技术前沿
- Energy-Based Transformers：提出基于能量的Transformer（EBT）模型，将人类System 2 Thinking建模为基于能量最小化的优化过程，在实现无监督思维系统能力上取得重大突破，重新定义了模型“理解”输出的方式。
风险提示
- 以上内容基于历史数据完成，在政策、市场环境发生变化时存在失效的风险；历史信息不代表未来。

市场有风险，投资需谨慎研究所分析师:肖承志SAC登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文SAC登记编号:S1340124100011Email:fengyuwen@cnpsec.com近期研究报告《微盘股的流动性风险在哪？——微盘股指数周报20250720》2025.07.21《大金融表现居前助指数突破，GRU行业轮动调入非银行金融——行业轮动周报20250713》-2025.07.14《低估值高盈利，基本面表现占优——中邮因子周报20250706》2025.07.07《基于宏观经济状态划分的BL模型与ETF实践》-2025.07.01《反转风格显著，小市值回撤——中邮因子周报20250622》-2025.06.23《关注基本面支撑，高波风格占优——中邮因子周报20250615》-2025.06.16《结合基本面和量价特征的GRU模型》-2025.06.05《Claude 4系列发布，谷歌上线编程智能体Jules——AI动态汇总20250526》-2025.05.27《谷歌发布智能体白皮书，Manus全面开放注册——AI动态汇总20250519》-2025.05.20《证监会修改《重组办法》，深化并购重组改革——微盘股指数周报20250518》-2025.05.19《通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型——AI动态汇总20250505》-2025.05.06 金工周报⚫Kimi K2发布研究模式。⚫风险提示：失效的风险；历史信息不代表未来。 -- 目录1 AI重点要闻..............................................................................41.1 Kimi K2发布.........................................................................41.2秘塔发布国内首个免费Deep Research....................................................61.3智源开源具身智能模型RoboBrain 2.0 32B................................................81.4 LG推出韩国首个混合推理模型EXAONE 4.0...............................................112企业动态................................................................................132.1 OpenAI发布ChatGPT智能体...........................................................132.2谷歌发布encoder-decoder架构模型T5Gemma.............................................153 AI行业洞察.............................................................................163.1《AI智能体运行安全测试标准》发布...................................................164技术前沿................................................................................184.1 Energy-Based Transformers：打破“前馈即推理”的旧范式..................................185风险提示................................................................................20 请务必阅读正文之后的免责条款部分2 图表目录图表1：Kimi K2评测...................................................................4图表2：Kimi K2对比实验...............................................................5图表3：秘塔AI中文测评................................................................6图表4：秘塔AI英文测评................................................................6图表5：跨空间和时间推理的基准比较.....................................................9图表6：RoboBrain 2.0模型架构图......................................................10图表7：RoboBrain 2.0空间推理对比1...................................................10图表8：RoboBrain 2.0空间推理对比2...................................................10图表9：EXAONE 4.0测评1..............................................................12图表10：EXAONE 4.0测评2.............................................................12图表11：ChatGPT Agent HLE测试结果...................................................14图表12：ChatGPT Agent DSBench........................................................14图表13：T5 Gemma vs. Gemma 2对比测评1...............................................15图表14：T5 Gemma vs. Gemma 2对比测评2...............................................15图表15：自回归架构比较...............................................................18图表16：EBT用于自回归建模...........................................................19 请务必阅读正文之后的免责条款部分3 请务必阅读正文之后的免责条款部分1AI重点要闻1.1KimiK2发布Kimi K2是北京月之暗面科技有限公司于2025年7月11日推出的新一代混合专家架构基础模型，凭借其万亿级参数规模与稀疏激活技术迅速成为全球AI领域的焦点。该模型总参数达1T，但通过MoE架构设计，每次推理仅激活32B参数，显著降低了计算资源消耗，同时保持了高性能表现。其技术核心在于MuonClip优化器的应用，解决了万亿参数模型训练中的稳定性问题，并在人类高质量数据稀缺的背景下提升了Token利用效率，开辟了新的Scaling空间。图表1：Kimi K2评测资料来源：Kimi，中邮证券研究所在性能表现上，Kimi K2在多项基准测试中刷新了开源模型的纪录。例如，在SWE Bench Verified、Tau2、AceBench等代码与Agent任务评测中，其成绩均达到开源模型的SOTA水平，尤其在自主编程、工具调用和数学推理三大维度展现出接近甚至超越闭源模型的实力。LiveCodeBench测试中，Kimi K2以53.7%的准确率领先GPT-4.1的44.7%，而SWE-bench Verified的多轮尝试通过率更高达71.6%，显著优于Claude 4等竞品。实际应用场景中，开发者反馈其能自动 4 请务必阅读正文之后的免责条款部分5生成兼具设计感的前端代码，甚至完成3D场景搭建，例如根据简单指令构建太空地球自转动画，并自动补充月球运动细节，展现了强大的多模态理解与执行能力。图表2：Kimi K2对比实验资料来源：Kimi，中邮证券研究所Kimi K2的另一个突破在于其通用Agent任务的优化。通过大规模工具调用数据合成和强化学习机制，模型能够将复杂需求拆解为可执行的ToolCall结构，例如分析13万行数据并自动生成统计图表与回归模型报告。前Anthropic工程师Pietro Schirano评价称，这是自Claude 3.5 Sonnet后首个能在生产环境中可靠使用的非Anthropic模型，尤其擅长并行工具调用与任务终止判断。此外，其风格化写作能力也备受赞誉，无论是将科研文本改写为初中生语言，还是模仿苹果广告文案，均能精准保留原意与风格特征。从架构设计看，Kimi K2与DeepSeek V3存在显著的技术趋同性，但前者通过减少注意力头数量至64个、增加专家数至384个，进一步优化了长上下文处理与稀疏性。这种设计使得模型在非英伟达硬件上也能高效运行，被业界视为对请务必阅读正文之后的免责条款部分6算力垄断的突破性尝试。开源策略与低成本API定价（输入/输出tokens分别按4元/16元每百万计费）加速了生态渗透，OpenRouter平台数据显示其发布两天内token使用量即超越xAI的Grok 4，而成本仅为Claude 4的20%。国际学术界对Kimi K2的涌现给予高度评价。《自然》杂志称其标志着中国AI领域的“又一个DeepSeek时刻”，而LMArena排行榜显示该模型已登顶全球开源模型榜首，并在社区投票中位列总榜第五。月之暗面联合创始人张宇韬以“Make Kimi Great Again”表达了对这一技术里程碑的期待，而外网开发者社区则普遍认为其在中文创意写作和Agent任务上的表现已超越DeepSeek R1，成为开源生态的新标杆。尽管存在推理速度较慢的短板，但Kimi K2通过架构创新与成本优势，正在重塑全球大模型竞争格局。1.2秘塔发布国内首个免费Deep Research秘塔AI于2025年7月15日正式推出国内首个免费开放的Deep Research（深度研究）功能，标志着中国AI领域在复杂信息处理与知识生产范式上的重要突破。这一功能不仅对标OpenAI等国际巨头的同类产品，更通过技术创新实现了普惠化落地，重塑了人机协作的研究模式。图表4：秘塔AI英文测评资料来源：秘塔AI，中邮证券研究所资料来源：秘塔AI，中邮证券研究所请务必阅读正文之后的免责条款部分7秘塔AI的深度研究功能采用分段强化学习策略，将传统高算力消耗的研究任务拆解为多个子任务并行处理，显著降低资源消耗的同时维持了高准确性。其技术核心在于动态生成的“问题链”机制——当用户输入复杂问题（如“超导领域造假事件的技术与社会象征关联”），系统会自主拆解为多层子问题，通过多轮迭代检索与交叉验证形成逻辑闭环。研究过程通过可视化界面实时展示：绿色节点代表已验证结论，紫色节点提示待完善分支，橙色节点则需补充信息，形成类似“透明大脑”的交互体验。这种设计解决了传统AI研究的“黑箱”问题，用户可随时回溯推理路径并核查信源，例如在分析O

点击免费查看完整报告

AI 动态汇总 20250721：Kimi K2 发布，秘塔发布国内首个免费 Deep Research

你可能感兴趣

【西部传媒互联网】全球AI应用全景指标周度跟踪-20240411：Kimi、文心一言和秘塔AI分列国内AI应用web端周访问量TOP3

AI周观察：AMD绩后表现反映市场高预期 KIMI K2 THINKING发布

【盘中宝】Grok4、Kimi K2等重磅大模型发布，机构称全球范围内新一轮AI“军备竞赛”已经开启，看好全球AI应用的加速落地，这家企业推进AI大模型在细分领域的应用

传媒行业周观察：AI产业趋势向上，国内首个长时长视频大模型Vidu发布演示；关注五一档影视催化

【大佬持仓跟踪】多模态+AIGC+华为，已发布国内首个视频百亿级参数多媒体大模型，最新AIGC产品创作助手微软Copilot，这家公司与华为在昇腾算力、AI大模型有合作

Grok 4 发布，通义开源智能体 WebSailor——AI 动态汇总 20250714

金工周报：AI动态汇总：Gemini2.5Pro发布即屠榜，DeepSeekV3完成模型更新

AI动态汇总20250421：OpenAI发布GPT-4.1，智谱发布GLM-4-32B-0414系列

AI动态汇总：AI模型通过标准图灵测试，智谱发布AI Agent AutoGLM沉思

金工周报：AI动态汇总-通义千问发布Qwen-3模型，DeepSeek发布数理证明大模型