您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:AI 动态汇总 20250721:Kimi K2 发布,秘塔发布国内首个免费 Deep Research - 发现报告

AI 动态汇总 20250721:Kimi K2 发布,秘塔发布国内首个免费 Deep Research

2025-07-24肖承志、冯昱文中邮证券杨***
AI智能总结
查看更多
AI 动态汇总 20250721:Kimi K2 发布,秘塔发布国内首个免费 Deep Research

市场有风险,投资需谨慎研究所分析师:肖承志SAC登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文SAC登记编号:S1340124100011Email:fengyuwen@cnpsec.com近期研究报告《微盘股的流动性风险在哪?——微盘 股 指 数 周 报20250720》2025.07.21《大金融表现居前助指数突破,GRU行业轮动调入非银行金融——行业轮动周报20250713》-2025.07.14《低估值高盈利,基本面表现占优——中 邮 因 子 周 报20250706》2025.07.07《基于宏观经济状态划分的BL模型与ETF实践》-2025.07.01《反转风格显著,小市值回撤——中邮因子周报20250622》-2025.06.23《关注基本面支撑,高波风格占优——中邮因子周报20250615》-2025.06.16《结合基本面和量价特征的GRU模型》-2025.06.05《Claude 4系列发布,谷歌上线编程智能体Jules——AI动态汇总20250526》-2025.05.27《谷歌发布智能体白皮书,Manus全面开放注册——AI动态汇总20250519》-2025.05.20《证监会修改《重组办法》,深化并购重组改革——微盘股指数周报20250518》-2025.05.19《通义千问发布Qwen-3模型,DeepSeek发布数理证明大模型——AI动态汇总20250505》-2025.05.06 金工周报⚫Kimi K2发布研究模式。⚫风险提示:失效的风险;历史信息不代表未来。 -- 目录1 AI重点要闻..............................................................................41.1 Kimi K2发布.........................................................................41.2秘塔发布国内首个免费Deep Research....................................................61.3智源开源具身智能模型RoboBrain 2.0 32B................................................81.4 LG推出韩国首个混合推理模型EXAONE 4.0...............................................112企业动态................................................................................132.1 OpenAI发布ChatGPT智能体...........................................................132.2谷歌发布encoder-decoder架构模型T5Gemma.............................................153 AI行业洞察.............................................................................163.1《AI智能体运行安全测试标准》发布...................................................164技术前沿................................................................................184.1 Energy-Based Transformers:打破“前馈即推理”的旧范式..................................185风险提示................................................................................20 请务必阅读正文之后的免责条款部分2 图表目录图表1:Kimi K2评测...................................................................4图表2:Kimi K2对比实验...............................................................5图表3:秘塔AI中文测评................................................................6图表4:秘塔AI英文测评................................................................6图表5:跨空间和时间推理的基准比较.....................................................9图表6:RoboBrain 2.0模型架构图......................................................10图表7:RoboBrain 2.0空间推理对比1...................................................10图表8:RoboBrain 2.0空间推理对比2...................................................10图表9:EXAONE 4.0测评1..............................................................12图表10:EXAONE 4.0测评2.............................................................12图表11:ChatGPT Agent HLE测试结果...................................................14图表12:ChatGPT Agent DSBench........................................................14图表13:T5 Gemma vs. Gemma 2对比测评1...............................................15图表14:T5 Gemma vs. Gemma 2对比测评2...............................................15图表15:自回归架构比较...............................................................18图表16:EBT用于自回归建模...........................................................19 请务必阅读正文之后的免责条款部分3 请务必阅读正文之后的免责条款部分1AI重点要闻1.1KimiK2发布Kimi K2是北京月之暗面科技有限公司于2025年7月11日推出的新一代混合专家架构基础模型,凭借其万亿级参数规模与稀疏激活技术迅速成为全球AI领域的焦点。该模型总参数达1T,但通过MoE架构设计,每次推理仅激活32B参数,显著降低了计算资源消耗,同时保持了高性能表现。其技术核心在于MuonClip优化器的应用,解决了万亿参数模型训练中的稳定性问题,并在人类高质量数据稀缺的背景下提升了Token利用效率,开辟了新的Scaling空间。图表1:Kimi K2评测资料来源:Kimi,中邮证券研究所在性能表现上,Kimi K2在多项基准测试中刷新了开源模型的纪录。例如,在SWE Bench Verified、Tau2、AceBench等代码与Agent任务评测中,其成绩均达到开源模型的SOTA水平,尤其在自主编程、工具调用和数学推理三大维度展现出接近甚至超越闭源模型的实力。LiveCodeBench测试中,Kimi K2以53.7%的准确率领先GPT-4.1的44.7%,而SWE-bench Verified的多轮尝试通过率更高达71.6%,显著优于Claude 4等竞品。实际应用场景中,开发者反馈其能自动 4 请务必阅读正文之后的免责条款部分5生成兼具设计感的前端代码,甚至完成3D场景搭建,例如根据简单指令构建太空地球自转动画,并自动补充月球运动细节,展现了强大的多模态理解与执行能力。图表2:Kimi K2对比实验资料来源:Kimi,中邮证券研究所Kimi K2的另一个突破在于其通用Agent任务的优化。通过大规模工具调用数据合成和强化学习机制,模型能够将复杂需求拆解为可执行的ToolCall结构,例如分析13万行数据并自动生成统计图表与回归模型报告。前Anthropic工程师Pietro Schirano评价称,这是自Claude 3.5 Sonnet后首个能在生产环境中可靠使用的非Anthropic模型,尤其擅长并行工具调用与任务终止判断。此外,其风格化写作能力也备受赞誉,无论是将科研文本改写为初中生语言,还是模仿苹果广告文案,均能精准保留原意与风格特征。从架构设计看,Kimi K2与DeepSeek V3存在显著的技术趋同性,但前者通过减少注意力头数量至64个、增加专家数至384个,进一步优化了长上下文处理与稀疏性。这种设计使得模型在非英伟达硬件上也能高效运行,被业界视为对 请务必阅读正文之后的免责条款部分6算力垄断的突破性尝试。开源策略与低成本API定价(输入/输出tokens分别按4元/16元每百万计费)加速了生态渗透,OpenRouter平台数据显示其发布两天内token使用量即超越xAI的Grok 4,而成本仅为Claude 4的20%。国际学术界对Kimi K2的涌现给予高度评价。《自然》杂志称其标志着中国AI领域的“又一个DeepSeek时刻”,而LMArena排行榜显示该模型已登顶全球开源模型榜首,并在社区投票中位列总榜第五。月之暗面联合创始人张宇韬以“Make Kimi Great Again”表达了对这一技术里程碑的期待,而外网开发者社区则普遍认为其在中文创意写作和Agent任务上的表现已超越DeepSeek R1,成为开源生态的新标杆。尽管存在推理速度较慢的短板,但Kimi K2通过架构创新与成本优势,正在重塑全球大模型竞争格局。1.2秘塔发布国内首个免费Deep Research秘塔AI于2025年7月15日正式推出国内首个免费开放的Deep Research(深度研究)功能,标志着中国AI领域在复杂信息处理与知识生产范式上的重要突破。这一功能不仅对标OpenAI等国际巨头的同类产品,更通过技术创新实现了普惠化落地,重塑了人机协作的研究模式。图表4:秘塔AI英文测评资料来源:秘塔AI,中邮证券研究所资料来源:秘塔AI,中邮证券研究所 请务必阅读正文之后的免责条款部分7秘塔AI的深度研究功能采用分段强化学习策略,将传统高算力消耗的研究任务拆解为多个子任务并行处理,显著降低资源消耗的同时维持了高准确性。其技术核心在于动态生成的“问题链”机制——当用户输入复杂问题(如“超导领域造假事件的技术与社会象征关联”),系统会自主拆解为多层子问题,通过多轮迭代检索与交叉验证形成逻辑闭环。研究过程通过可视化界面实时展示:绿色节点代表已验证结论,紫色节点提示待完善分支,橙色节点则需补充信息,形成类似“透明大脑”的交互体验。这种设计解决了传统AI研究的“黑箱”问题,用户可随时回溯推理路径并核查信源,例如在分析O