谷歌Agent与多模态能力重磅升级,国内外模型持续进化 Gemini 3.5 flash和Omni发布,谷歌Agent与多模态能力重磅升级。截至2026/5/19,谷歌已经有13款产品的用户数均超过10亿,其中5款产品的用户数已突破30亿,而Gemini是其重要的驱动因素。1)2025/5/19,谷歌发布了Gemini 3.5 flash,这一最新模型系列将前沿智能与行动能力融为一体,标志着谷歌在Agent方面迈出了重大一步。3.5 flash模型不仅具备面向智能体和编程的前沿能力,还保持了Flash系列一贯的高速性能,可以规模化处理智能体任务。依托Gemini 3.5 flash模型能力,谷歌发布可全天候运行的个人Agent智能体Spark,它深度集成谷歌生态,即使用户关闭终端也可以在云端持续工作。2)Gemini Omni发布,它是一款能够从任何模态输入生成任何内容的模型。用户可以整合图像、音频、视频和文本作为输入,生成基于Gemini真实世界知识的高质量视频。GeminiOmni具备对物理世界的较深认知,能够更好地实现创意与现实的落地结合。 增持(维持) 国产大模型进展飞速,编程与Agent等方面全面跟进。1)智谱:2026/5/12,GLM-5.1获AA全新Coding Agent基准开源第一。ArtificialAnalysis在官方推文中点明了这一新榜单的“含金量”:GLM 5.1代表了国产大模型编程agent的SOTA级别能力。随后,智谱推出GLM-5.1高速版,可以以400 tokens/s的速度,兼顾模型质量与速度。2)月之暗面:2026/4/20,月之暗面发布并开源Kimi K2.6模型,带来行业领先的代码、长程任务执行和Agent集群能力。Kimi K2.6是月之暗面迄今最强的代码模型,在长程代码任务中的表现取得了突破,面对不同编程语言(如Rust、Go、Python)和任务场景(如前端、运维、性能优化)均具备更可靠的泛化能力。3)Minimax:发布了MMX-CLI,一款为Agent设计的全模态命令行工具,Agent工作流进一步完整化自动化。由于底层设计上针对Agent做了专门优化,提升了Agent在自动化运行中的稳定性和解析的准确性。 作者 分析师孙行臻执业证书编号:S0680526010001邮箱:sunxingzhen1@gszq.com 分析师陈泽青执业证书编号:S0680523100001邮箱:chenzeqing3655@gszq.com 相关研究 1、《计算机:算力租赁专题一:涨价趋势持续,探析中美算租模式差异》2026-05-142、《计算机:Claude Opus 4.7发布,复杂任务能力提升利好Agent落地》2026-04-183、《计算机:OpenClaw引爆智能体浪潮,Token消耗迎来指数级跃升》2026-03-08 投资建议:关注AI大模型对软件行业带来的重构升级。我们认为,全球大模型能力的持续进化,将不断更新终端用户的使用体验,使得AI agent生态进一步繁荣,进而对软件行业实现全面的升级创造。我们继续看好AI大模型对软件行业带来的重构升级,建议关注拥有Coding及Agent能力的大模型厂商,例如:智谱、minimax、科大讯飞等。 风险提示:技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 内容目录 1.谷歌全栈AI蓬勃发展,Agent与多模态能力重磅升级.....................................................................................31.1 Gemini 3.5 Flash发布,补齐Agent和编程能力短板.............................................................................51.2 Gemini Omni发布,多模态能力与物理世界认知表现升级.....................................................................92.国产大模型进展飞速,编程与Agent等方面全面跟进....................................................................................112.1智谱:GLM-5.1获AA全新Coding Agent基准开源第一,推出高速版兼顾速度与质量........................112.2 Kimi:发布并开源k 2.6,代码、长程任务执行和Agent集群能力更进一步.........................................132.3 Minimax:发布MMX-CLI,Agent可用性持续提升...............................................................................153.投资建议......................................................................................................................................................18风险提示.........................................................................................................................................................18 图表目录 图表1:谷歌已有13款产品用户数突破10亿..................................................................................................3图表2:Ask Youtube功能有望重塑视频体验...................................................................................................4图表3:谷歌AI token消耗量飙升...................................................................................................................5图表4:Gemini 3.5 flash模型性能benchmark.................................................................................................6图表5:Artificial Analysis指数与输出速度的对比象限......................................................................................7图表6:Gemini 3.5 flash可以使用两个智能体在Antigravity环境中通过快速自我改进循环来开发游戏............7图表7:谷歌Spark可自主运行工作................................................................................................................8图表8:Omni可以通过自然语言对视频进行精细修改......................................................................................9图表9:Omni具备较强的融合知识与创造力..................................................................................................10图表10:Artificial Analysis的编程agent排名榜............................................................................................11图表11:智谱推出GLM 5.1高速版...............................................................................................................12图表12:GLM 5.1高速版实测2:输入文件后瞬时3D建模............................................................................13图表13:kimi 2.6主要benchmark................................................................................................................14图表14:kimi 2.6复杂长程任务表现相比K2.5有所提升................................................................................15图表15:Minimax发布MMX-CLI...................................................................................................................16 1.谷歌全栈AI蓬勃发展,Agent与多模态能力重磅升级 Gemini模型推动谷歌产品生态强势发展。截至2026/5/19,谷歌已经有13款产品的用户数均超过10亿,其中5款产品的用户数已突破30亿。在这之中,Gemini模型是推动更多用户使用谷歌产品、并更频繁使用这些产品的重要原因。 图表1:谷歌已有13款产品用户数突破10亿 资料来源:谷歌官网,国盛证券研究所 ⚫谷歌AI搜索月活用户数已突破10亿大关,用户搜索频率高于传统搜索。谷歌的搜索业务,正在将生成式AI的益处传播向世界。AI概览(AI Overview)现已拥有超过25亿月活跃用户。而AI模式更是一项革命性突破,是谷歌对搜索有史以来最大的一次升级。用户对此高度赞赏,仅用一年时间,其月活跃用户就已突破10亿大关。当用户在搜索中使用我们的人工智能功能时,他们使用搜索的频率更高了。搜索已不再局限于单个查询,而更像是一场持续的对话,为用户提供更深入的见解,并帮助用户连接广阔的互联网世界。 ⚫Gemini月活用户数已突破9亿,一年内增长超过一倍。另一个谷歌快速创新的领域是Gemini应用。去年在I/O大会上,Gemini应用的月活跃用户数为4亿。如今,这一数字已突破9亿,一年内增长超过一倍。与此同时,每日请求量增长了七倍以上。谷歌为gemini应用添加了许多独特功能,例如个人智能,使回复更加个性化和实用。迄今为止,已有超过500亿张图像通过Nano Banana图像生成模型生成。在过去一年中,它成为了一颗脱颖而出的明星,展现了世界上潜藏的无限创造力。 ⚫除此之外,公司正尝试更自然地将对话式AI引入更多产品,一系列新