行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Gemini3Pro在多模态和生产力落地层面超预期1119

2025-11-19 未知机构邵泽

Gemini的体系迭代愈发完整和稳健：1代解决原生多模态和长文本，2代奠定Agent能力，3代能力完全释放（多模态理解+Agent+Coding），展现出漂亮的迭代曲线。

Gemini 3 Pro的亮点： 1）多模态理解能力：目前视频生成尚未与LLM有机统一，但多模态理解已成为Gemini的强项。 2）生产力落地能力（Agent能力）：通过Vending-Bench 2指标测试模型的长远规划能力，Gemini 3 Pro在模拟自动售货机业务的一年运营中保持一致的工具使用和决策制定，推动更高回报而不偏离任务，达到生产力落地层面。

参数猜测：据Artificial Analysis数据，Gemini 3 Pro在准确率方面领先，参数规模与准确率高度相关，推测3 Pro参数规模较大。但幻觉率与2.5代差距不大，幻觉率问题尚未解决。

超预期因素：

技术维度：Gemini 3 Pro在预训练+RL范式上符合大模型发展路径，但全新训练的sparse MoE和崭新的backbone架构超预期，模型架构有改进。Grok-4.1用推理模型部分解决RL泛化问题，对RL技术本质有贡献，也属超预期。
应用维度：Gemini 3在LMArena文本领域得分1501，首个超1500分的模型；前端开发、视觉理解榜首；Vending-Bench 2领先，均为应用维度的超预期。

Gemini的体系迭代愈发完整和稳健：1代解决原生多模态和长文本，2代奠定Agent能力，3代能力完全释放（多模态理解+Agent+Coding）。漂亮的迭代曲线。 Gemini 3 Pro的亮点：1）多模态理解能力。目前视频生成还没有和LLM有机统一，但是多模态理解已经成为G Gemini 3 Pro在多模态和生产力落地层面超预期（1119） Gemini的体系迭代愈发完整和稳健：1代解决原生多模态和长文本，2代奠定Agent能力，3代能力完全释放（多模态理解+Agent+Coding）。漂亮的迭代曲线。 Gemini 3 Pro的亮点：1）多模态理解能力。目前视频生成还没有和LLM有机统一，但是多模态理解已经成为Gemini的强项。 2）生产力落地能力（也是Agent能力）。可以关注Vending-Bench 2指标，这个指标通过管理一个模拟自动售货机业务来测试模型更长远的规划能力，已经到了生产力落地层面。 Gemini 3 Pro在整个模拟的一年运营中保持了一致的工具使用和决策制定，推动了更高的回报而不偏离任务。参数猜测：据Artificial Analysis数据，3 Pro在准确率方面领先，而参数规模与准确率高度相关，因此3 Pro可能是个参数很大的模型。不过3 Pro的幻觉率和2.5差距不大，幻觉率这块还没很好解决。什么模型才是超预期？「技术维度」，Gemini 3 Pro依然在预训练+RL的范式上，可以认为是符合大模型发展路径的预期。但是Gemini 3 model card也强调，并不是不是上一代Gemini 2.5的微调，而是全新训练的sparse MoE，崭新的backbone，这是超预期的，因为模型架构有改进。另外，前天的Grok-4.1用推理模型部分解决RL的泛化问题，这个是超预期的，因为对RL技术本质有贡献。「应用维度」，beat OpenAI的GPT就是超预期。因为OpenAI之前是leader，市场要求最高，而Google今年是loser转winner，所以任何进步都是市场可以把握的超预期。 Gemini 3在LMArena文本领域得分1501，是首个超1500分的模型；前端开发、视觉理解榜首；在Vending-Bench 2领先，这是应用维度的超预期。

点击免费查看完整报告

Gemini3Pro在多模态和生产力落地层面超预期1119

你可能感兴趣

【自动驾驶里程碑】四部委发布L3/L4国家层面试点通知，《关于开展智能网联汽车准入和上路通行试点工作的通知》以推动在乘用车L3，出行服务L4，商业化落地

坦桑尼亚的商业环境和生产力：来自企业层面数据的证据

中文理解和多模态生成能力优秀，文心一言有望革新生产力

电商和广告超预期，集团层面盈利大幅改善

【#美图公司01357.HK 】聚焦生产力和全球化，付费率提升超预期，上调目标价至4.5港元

多模态预训练模型在OPPO端云场景的落地实践

多模态LLM在云音乐推荐场景的落地应用_潘一飞

增强社区和国家在国家和东盟层面保护生物多样性的能力：现状，挑战和前进的道路

在多边层面分享经验的理由：产品特定原产地规则和原产地证明的事实趋同

企业动态在厄瓜多尔总生产力、就业流动和工资不平等中的作用

Gemini3Pro在多模态和生产力落地层面超预期1119

你可能感兴趣

【自动驾驶里程碑】四部委发布L3/L4国家层面试点通知，《关于开展智能网联汽车准入和上路通行试点工作的通知》以推动在乘用车L3，出行服务L4，商业化落地

坦桑尼亚的商业环境和生产力：来自企业层面数据的证据

中文理解和多模态生成能力优秀，文心一言有望革新生产力

电商和广告超预期，集团层面盈利大幅改善

【#美图公司01357.HK 】聚焦生产力和全球化，付费率提升超预期，上调目标价至4.5港元

多模态预训练模型在OPPO端云场景的落地实践

多模态LLM在云音乐推荐场景的落地应用_潘一飞

增强社区和国家在国家和东盟层面保护生物多样性的能力 ： 现状 ， 挑战和前进的道路

在多边层面分享经验的理由：产品特定原产地规则和原产地证明的事实趋同

企业动态在厄瓜多尔总生产力、就业流动和工资不平等中的作用

增强社区和国家在国家和东盟层面保护生物多样性的能力：现状，挑战和前进的道路