您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国新证券]:谷歌Gemini 3与NanoBanana Pro发布 - 发现报告

谷歌Gemini 3与NanoBanana Pro发布

信息技术 2025-11-27 钟哲元 国新证券 玉苑金山
报告封面

2025年11月27日 谷歌Gemini 3与NanoBanana Pro发布 看好 事件 2025年11月,谷歌推出新一代旗舰大模型Gemini3系列、专业图像生成模型NanoBananaPro及开发平台Antigravity,标志着其“芯片-云-模型-应用”全栈布局的深化。 核心观点 Gemini3依托自研第七代TPU芯片Ironwood构建的算力集群,实现单芯片FP8算力4614TFLOPS、HBM容量192GB,集群规模达9216颗芯片,通过光电路交换网络达成9.6Tb/s互联带宽,为AI推理提供高性能、低能耗支撑。 数据来源:Wind,国新证券整理 Gemini3支持百万级输入与64K输出,多模态基准测试全面领先:在Humanity's Last Exam学术推理测试中达37.5%,Math ArenaApex数 学 竞 赛 测 试 得 分23.4%,ScreenUnderstanding能 力 以72.7%准确率居首。其DeepThink模式通过多步推理与验证机制,在ARC-AGI评测中取得45.1%成绩,解决复杂问题的能力显著提升。NanoBananaPro则融合物理逻辑渲染与文本纠错技术,原生支持2K分辨率输出,解决图像生成领域的中英文文本渲染错误痛点,满足专业视觉创作需求。 谷歌通过TPU芯片、云计算基础设施与模型能力的深度协同,构建成本优势:TPUv7每瓦性能较前代提升两倍,单位算力成本仅为英伟达高端GPU的五分之一。2025年谷歌云业务订单积压达1550亿美元,同比增长82%,显示市场需求强劲。Antigravity平台整合智能体管理与多模态开发工具,支持开发者通过自然语言交互实现代码转换与系统操作,推动AI从工具向协作伙伴升级。 投资线索 算力基础设施:关注光模块、液冷技术及高带宽互联设备领域,受益于AI集群规模化部署带来的硬件升级需求。 分析师:钟哲元登记编码:S1490523030001邮箱:zhongzheyuan@crsec.com.cn 应用场景落地:挖掘企业服务、营销科技等垂直领域机会,重点关注能整合多模态AI能力、优化生产效率与用户体验的场景化解决方案。 生态协同创新:紧跟头部企业资本开支节奏,布局算力硬件核心供应商,同时把握AI Agent技术驱动的软件开发与工具迭代机遇。 风险提示 1、 技术发 展不及 预期;2、 市场 竞争加 剧;3、 地缘政 治影响 。 证券研究报告 目录 一、谷歌大模型技术进阶............................................................................................................................................................3二、GEMINI 3的技术架构与性能表现.....................................................................................................................................3三、NANOBANANA PRO的图像生成与专业应用.................................................................................................................3四、全栈能力:从芯片到模型的协同效应................................................................................................................................4五、商业化进展与生态整合........................................................................................................................................................4六、投资线索................................................................................................................................................................................5七、风险提示................................................................................................................................................................................5 一、谷歌大模型技术进阶 2025年11月,谷歌在人工智能领域掀起技术革新浪潮,接连推出新一代旗舰大模型Gemini 3系列、专业图像生成模型NanoBanana Pro(官方命名为Gemini3 Pro Image),并同步发布创新性开发平台Antigravity。这一系列发布不仅彰显了谷歌在多模态理解、推理与Agent技术领域的全面突破,更凸显其从底层算力基础设施到上层应用生态的全栈布局战略,标志着AI技术正式迈入“自主推理+多模态执行”的新阶段。尤为关键的是,Gemini 3的研发与训练全程依托谷歌自研第七代TPU芯片Ironwood(TPUv7)构建的大规模集群,该芯片专为推理场景优化,单芯片FP8峰值算力高达4614 TFLOPS,HBM容量达192GB,芯片互连带宽1.2Tbps, 集 群 规 模 可 扩 展 至9216颗 , 通 过 光 电 路 交 换 (OCS) 网 络 实 现9.6Tb/s的超高互联带宽,既为模型提供了坚实的底层算力支撑,也印证了谷歌“芯片-云-模型-应用”全链条协同的技术路线优势。 二、Gemini 3的技术架构与性能表现 作为本次发布的核心旗舰模型,Gemini 3在技术架构与性能表现上实现了全方位提升,支持最高约100万tokens的输入上下文窗口与最大64K tokens的输出容量,能够高效处理文本、图像、视频、音频乃至代码等多种模态数据,在几乎所有主流AI基准测试中均显著超越前代产品及行业竞品。在学术推理领域,其无工具辅助状态下在Humanity's Last Exam测试中得分37.5%,GPQA Diamond测试中更是达到91.9%的高分;在Math Arena Apex测试中以23.4%的成绩拿下最新SOTA,较前代实现翻倍提升。尤为突出的是其ScreenUnderStanding能力,在ScreenSpot-Pro评测基准中获得72.7%的高分,大幅领先Claude Sonnet 4.5(36.2%)和GPT 5.1(3.5%),能够精准解读结构化与非结构化文档,为AI直接操作图形界面(GUI)奠定了基础。此外,Gemini 3创新性引入DeepThink模式,通过Thought Signatures(思维签名)与Thinking Levels(思考等级)的产品化封装,让模型在输出结果前能够进行多步推理、反思与验证,开发者可根据任务复杂度灵活配置思考时长,在ARC-AGI评测中更是取得45.1%的优异成绩,展现出解决新颖复杂挑战的强大能力。其智能体能力通过Antigravity开发平台深度集成,实现了代码编辑器与终端的直接访问,支持复杂软件任务的自主规划、多步骤工具调用与高效执行,在LMArena大模型竞技场上以1501 Elo的突破性评分位列公开模型首位。 三、NanoBanana Pro的图像生成与专业应用 NanoBanana Pro作 为 谷 歌 面 向 专 业 视 觉 内 容 创 作 的 重 磅 产 品 , 融 合 了Gemini 3的先进推理架构与世界模型技术,在图像生成领域实现了物理逻辑与文本 渲染的双重突破。该模型超越传统扩散模型的局限,在渲染场景前会进行专业的场景规划,能够生成具备物理精确光照效果的高质量图像,原生支持2K分辨率输出,更完美解决了长期困扰图像生成领域的文本渲染错误痛点,支持中英文等多语言文本的清晰呈现,用户可自定义字体类型或模拟手写风格,为海报制作、复杂图表设计、精细产品模型展示等专业场景提供了可靠支撑。依托Gemini 3对现实世界的深刻理解与强大推理能力,NanoBanana Pro能够生成精准、细致且富含专业知识的图像内容,不仅可以为图片添加专业注释、将复杂数据转化为直观信息图表,还能实现手写笔记到标准化图表的转换,在人物一致性控制上最多可保持5人特征稳定,同时支持局部编辑与4K分辨率拓展输出,为广告营销、科研可视化、教育科普等多个领域提供工作室级的视觉生成能力。 四、全栈能力:从芯片到模型的协同效应 谷歌此次技术发布的核心竞争力,源于其从芯片到应用的全栈协同效应,这种协同体系构建了难以复制的技术护城河。在芯片层面,TPU系列芯片经过多代迭代已形成成熟的训推一体ASIC体系,TPUv7采用HBM3e显存,带宽达7.4TB/s,每瓦性能较前代提升两倍,在实现相近算力水平时,成本仅为英伟达高端GPU的五分之一,有效降低了模型训练与推理的整体拥有成本(TCO)。在云端部署方面,谷歌持续加大AI基础设施投入,将2025年资本支出上修至910-930亿美元,并预计2026年资本支出将“显著增加”,强劲的投入支撑起庞大的云业务规模,2025年三季报披露其云业务订单积压已达1550亿美元,环比增长46%,同比增长82%,展现出旺盛的市场需求。模型层面,Gemini 3通过与TPU芯片的深度协同优化,实现了算力效率与模型性能的同步提升,而Antigravity开发平台则作为连接模型与开发者的关键枢纽,提供了AI驱动的IDE编辑器视图与多智能体管理界面,让智能体拥有专属工作空间,支持“人+Agent”的协同开发模式,将AI辅助从工具升级为积极的合作伙伴。这种全栈协同模式,使得谷歌能够在技术迭代速度、成本控制与应用落地效率上形成复利优势,持续巩固行业领先地位。 五、商业化进展与生态整合 在商业化进展与生态整合方面,谷歌已构建起覆盖C端用户、企业客户与开发者群体的完整生态闭环。面向C端市场,Gemini App作为独立AI助手已积累6.5亿全球月活跃用户,其AI Overview功能深度集成谷歌搜索,直接覆盖数十亿次搜索请求,通过生成式UI技术实现“搜索即应用”的全新体验,同时AI能力已全面融入Google Workspace(Gmail/Docs/Sheets)等核心办公产品,未来将依托订阅服务与广告变现模式实现规模化商业价值转化。面向企业客户与开发者,谷歌开放了Gemini 3的API接口,截至2025年Q3,模型每分钟处理Token数量已达70亿,Android Studio、Firebase、Gemini CLI等开发工具已全部接入该模型,开 发者可通过自然语言交互方式快速实现Shell命令转换与系统级操作,大幅降低AI应用开发门槛。商业合作层面,谷歌与AI公司Anthropic签署了100万颗定制TPU芯片的采购协议,标志着TPU芯片正式进入商业级服务市场,进一步拓展了其算力生态的商业化边界。这种多维度的生态整合,使得Gemini 3的技术能力能够快速渗透到消费、办公、开发、企业服务等多个场景,加速了AI技术的商业化落地进程。 六、投资线索 谷歌凭借“芯片-模型-云”全栈闭环构建了独特竞争优势,而阿里则通过开源生