AI智能总结
计算机2025年11月24日 计算机行业重大事项点评 推荐 (维持) Google:Gemini 3开启全模态革命 事项: 华创证券研究所 2025年11月19日,Google正式发布Gemini 3,它不仅是全球领先的多模态理解模型,更是Google迄今为止最强大的智能体(Agentic)和氛围编程(VibeCoding)模型。 证券分析师:吴鸣远邮箱:wumingyuan@hcyjs.com执业编号:S0360523040001 评论: 联系人:周志浩邮箱:zhouzhihao1@hcyjs.com Gemini 3:性能全面进化,强化Google AI竞赛领先地位。Gemini 3在技术层面表现卓越:以1501分登顶LMArena排行榜,在推理、数学及多模态领域均创下最佳成绩,包括GPQA Diamond 91.9%准确率、MathArena Apex 23.4%领先水平等。同时完成"人格进化",对话更简洁直接。在应用层面,依托百万token上下文窗口,实现"学习、构建、规划"三大突破:不仅可转化视频、论文为交互学习材料,更在WebDev Arena、SWE-bench等编程基准中表现优异,LiveCodeBench Pro成绩2439分,展现其强大的复杂任务处理能力。 行业基本数据 Gemini 3:Deep Think开启深度思考新纪元,显著拓展智能边界。Google还推出了一个增强推理模式:Gemini 3 Deep Think,旨在将Gemini 3的性能推向更高的高度。Gemini 3 Deep Think模式通过拓展智能边界,为攻克更复杂难题提供了强大支持:在“人类最终考试”中,其无工具辅助得分率达到41.0%,GPQA Diamond测试准确率提升至93.8%,均超越了原版Gemini 3 Pro的卓越表现;同时,在启用代码执行的ARC-AGI-2基准测试中更取得45.1%的突破性成绩,充分展现了其应对新型复杂挑战的领先能力。 %1M6M12M绝对表现2.5%24.7%25.2%相对表现0.8%6.4%9.8% Google:全新智能体开发平台Antigravity,迈向Agent新阶段。该平台深度集成Gemini 3的强大推理与编码能力,将其从辅助工具升级为能自主规划、执行并验证复杂软件工程的活跃伙伴。Antigravity为智能体提供了专属界面,并赋予其直接操作编辑器、终端和浏览器的权限,其能力背后更融合了用于浏览器控制的Gemini 2.5 Computer Use模型及Nano Banana图像编辑模型,共同构成一个完整的开发生态。同时,Gemini 3在Vending-Bench 2等测试中展现出的卓越长期规划能力,以及面向订阅用户推出的、可处理多步骤工作流程的Gemini Agent功能,都进一步印证了其将复杂任务抽象化、让开发者从繁琐细节中解放出来的核心愿景。 相关研究报告 《计算机行业重大事项点评:鸿蒙:生态技术双突破,自主底座能力再巩固》2025-11-18《计算机行业深度研究报告:海外AI应用:从 大模型到各领域落地》2025-11-18《 计 算 机 行 业 重 大 事 项 点 评 :Sota:Kimi K2Thinking开源思考模型发布》2025-11-12 Google:“芯片-模型-生态”全栈式战略,构筑深厚壁垒。Gemini 3作为集大成者,不仅在各技术维度全面领先,更展现出完整的生态布局:硬件层面,基于自研Trillium TPU实现算力4倍提升,新一代Ironwood TPU有望将性能提升10倍,支持超大规模集群;开发者生态方面,通过AI Studio、Antigravity等平台提供完整工具链;应用层面深度整合至月活20亿的搜索等产品。这一闭环生态已取得显著成效:Gemini系列在两年内完成三次迭代,月活用户突破6.5亿,获超70%云端客户采用,形成难以复制的系统性优势。 投资建议:建议关注AI细分景气方向: 国产算力:寒武纪、海光信息、阿里巴巴、中科曙光、景嘉微、龙芯中科等。 企业服务:1)办公:金山办公、合合信息、福昕软件;2)多模态:海康威视、快手、三六零、虹软科技;3)ERP:金蝶国际、用友网络、聚水潭;4)OA:泛微网络、致远互联;5)编程:卓易信息;6)营销:迈富时、明源云。 应用场景:1)金融:大智慧、同花顺、恒生电子、第四范式、宇信科技、京北方、中科金财;2)教育:科大讯飞、视源股份、新开普、佳发教育;3)法律:华宇软件、金桥信息;4)医疗:阿里健康、卫宁健康、讯飞医疗科技、晶泰控股;5)电商:焦点科技;6)安全:深信服;7)工业:华大九天、中控技术、中望软件、索辰科技;8)军用:中科星图、太极股份、能科科技等。 风险提示:技术进展不及预期;模型落地不及预期;商业落地不及预期。 目录 一、Gemini 3:性能全面进化,强化Google AI竞赛领先地位..................................4二、Gemini 3:Deep Think开启深度思考新纪元........................................................5三、Google:全新智能体开发平台Antigravity,迈向Agent新阶段........................6四、Google:“芯片-模型-生态”全栈式战略,构筑深厚壁垒....................................6五、投资建议.....................................................................................................................7六、风险提示.....................................................................................................................7 图表目录 图表1 Gemini 3的基准测试结果.........................................................................................4图表2 Gemini 3 Pro在LiveCodeBench Pro上的表现........................................................5图表3 Gemini 3 Deep Think模式在一些最具挑战性的AI基准测试中的表现................5图表4 Gemini 3 Pro展现出更强的长期规划能力...............................................................6图表5 GoogleTPU产品技术规格比较................................................................................7 一、Gemini 3:性能全面进化,强化Google AI竞赛领先地位 Gemini 3的技术突破显著强化了Google在AI竞赛中的领先地位。凭借其卓越的推理能力与强大的多模态功能,Gemini 3 Pro能够将各类创意转化为现实,并在所有关键人工智能基准测试中显著超越前代2.5 Pro模型。该模型以1501的突破性Elo评分高居LMArena排行榜榜首,不仅在推理能力上达到博士水平——在“人类终极考试”中无工具辅助得分率达37.5%,并在GPQA Diamond基准测试中取得91.9%的最高准确率,还在数学领域树立了全新标杆,于MathArena Apex测试中以23.4%的成绩达到当前最先进水平。此外,Gemini 3 Pro在多模态理解方面表现突出,在MMMU-Pro和Video-MMMU上分别获得81%与87.6%的优异成绩,同时以72.1%的得分在SimpleQAVerified基准测试中创下事实准确性方面的新纪录,充分彰显其卓越的可靠性以及应对科学、数学等跨领域复杂问题的强大能力。 Gemini 3实现性能与性格双重进化。在实现技术性能跨越式提升的同时,Gemini 3更完成了一次深刻的“人格进化”,致力于以更聪明、简洁和直接的对话方式,直面用户真实需求而非一味迎合。长期以来,为追求安全与对齐,大模型习惯于顺从用户错误前提或输出模棱两可的回应,而Gemini系列此前在这一问题上尤为突出。如今Google正全力扭转这一刻板印象,在具体应用层面,Gemini 3聚焦于“学习任何东西、构建任何东西、规划任何东西”三大方向:其依托百万token上下文窗口,能够解析长篇论文、多小时视频等内容,并将其转化为交互式学习资源,例如整理多语言手写食谱成书、将学术内容转为可视化闪卡,甚至分析运动视频并生成个性化训练计划;在构建能力方面, 该模型在WebDev Arena(Elo 1487)、Terminal-Bench 2.0(54.2%)、以及关键指标SWE-bench Verified(76.2%)等编程基准中表现卓越,被官方誉为“最佳氛围编程与智能体模型”;更在奥赛级编程评测LiveCodeBench Pro中以2439分的成绩大幅领先第二名近200分,展现出其在复杂代码生成与终端操作任务中的强大实力。 二、Gemini 3:Deep Think开启深度思考新纪元 Gemini 3 Deep Think开启深度思考新纪元,显著拓展智能边界。Google还推出了一个增强推理模式:Gemini 3Deep Think,旨在将Gemini 3的性能推向更高的高度。Gemini 3Deep Think模式通过拓展智能边界,为攻克更复杂难题提供了强大支持:在“人类最终考试”中,其无工具辅助得分率达到41.0%,GPQA Diamond测试准确率提升至93.8%,均超越了原版Gemini 3 Pro的卓越表现;同时,在启用代码执行的ARC-AGI-2基准测试中更取得45.1%的突破性成绩,充分展现了其应对新型复杂挑战的领先能力。 资料来源:Google、华创证券 三、Google:全新智能体开发平台Antigravity,迈向Agent新阶段 Google推出全新的智能体开发平台Antigravity,开发者迈向以任务为导向的新阶段。该平台深度集成Gemini 3的强大推理与编码能力,将其从辅助工具升级为能自主规划、执行并验证复杂软件工程的活跃伙伴。Antigravity为智能体提供了专属界面,并赋予其直接操作编辑器、终端和浏览器的权限,其能力背后更融合了用于浏览器控制的Gemini 2.5Computer Use模型及Nano Banana图像编辑模型,共同构成一个完整的开发生态。同时,Gemini 3在Vending-Bench 2等测试中展现出的卓越长期规划能力,以及面向订阅用户推出的、可处理多步骤工作流程的Gemini Agent功能,都进一步印证了其将复杂任务抽象化、让开发者从繁琐细节中解放出来的核心愿景。 资料来源:Google、华创证券 四、Google:“芯片-模型-生态”全栈式战略,构筑深厚壁垒 Google凭借“芯片-模型-生态”三位一体的全栈式战略,构筑深厚的竞争壁垒。Gemini3作为这一战略的集大成者,不仅在推理、多模态、编程等核心技术维度全面领先,更展现出Google独特的生态优势:在硬件层面,基于自研第六代Trillium TPU芯片,实现算力较前代提升4倍、能耗降低67%的突破性表现,并且根据11月6日Google云在官方博客宣布,新一代Ironwood TPU即将上市,