您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:AI周观察:谷歌发布TPUv7和新模型应用,国内AI应用访问量提升 - 发现报告

AI周观察:谷歌发布TPUv7和新模型应用,国内AI应用访问量提升

信息技术2025-04-13刘道明、黄晓军、麦世学国金证券S***
AI智能总结
查看更多
AI周观察:谷歌发布TPUv7和新模型应用,国内AI应用访问量提升

摘要 -谷歌在Cloud Next 25发布第七代TPU Ironwood (TPU v7),显著提升AI定制硬件能力。该芯片是谷歌首款主攻AI推理的TPU,旨在驱动LLMs、MoEs等复杂模型以迎接“推理时代”。性能大幅提升,支持高达9,216 芯片的42.5 Exaflops (FP8)集群,单芯片HBM增至192GB。尤为关键的是,其能效(性能功耗比)较上一代Trillium提升近2倍。Ironwood强化了谷歌在AI推理基础设施的布局,旨在以高性能、高效率平台满足未来AI需求,增强自身服务及云业务竞争力,预计2025年下半年上市。 -访问量数据,海外主要AI应用周度环比呈现小幅增长,而国内AI应用活跃度显著上升,其中文心一言、Kimi、豆包和通义千问的环比增长均超过25%,元宝的访问量也上升了约18%。 -在2025年4月9日的Google Cloud Next 2025大会上,谷歌发布了开源智能体开发框架Agent Development Kit (ADK),旨在简化多智能体系统的构建、管理和部署。同时,谷歌还推出了注重效率的推理模型Gemini 2.5 Flash,并计划在第三季度支持Gemini模型的本地部署。此外,谷歌云Vertex AI平台新增了视频、图像、语音和音乐生成AI工具,并发布了旨在实现跨平台智能体通信与协作的开放协议Agent2Agent (A2A)。 -持续的关税争端给存储市场带来显著不确定性。虽然新季度价格谈判已在进行,但最终定价不明朗。现货市场交易放缓,短期供需平稳,但潜在风险不容忽视。终端电子产品制造商正评估关税影响,担心成本上升导致售价提高、销量下滑。这种压力预期将传导至上游存储芯片,抑制未来的备货需求。 -相比于PC设备,手机硬件提升的空间有限,在已有的硬件框架里提升效率能更加有效的推动端侧AI的发展。联发科在天玑9400+里对NPU的开发是值得关注的。此前手机SoC中虽然NPU可以帮助端侧设备完成一些推理任务,但大多数任务仍是由SoC中的GPU完成的。我们认为在NPU能力不断开发、模型能力不断提升的情况下,手机端侧AI开发将会加速。 -我们认为,苹果折叠屏产品进入市场后将会促进折叠屏手机销量增长,同时带动消费者对于折叠屏产品的热情,最终推动其他消费电子厂商与产业链跟进。 风险提示 芯片制程发展与良率不及预期中美科技领域政策恶化智能手机销量不及预期 海外市场行情回顾 图表1:截至4月11日海外AI相关个股行情 GoogleCloudNext发布新模型和应用 图表2:聊天助手类AI应用活跃度 从聊天助手访问量看,海外主要AI应用周度环比多数个位数小幅上升,国内AI应用活跃度上升明显,文心一言、Kimi、豆包和通义千问环比均上升超过25%,元宝访问量上升约18%。 2025年4月9日,在拉斯维加斯举行的Google Cloud Next 2025大会上,谷歌正式发布了Agent Development Kit(ADK),一款全新的开源智能体开发框架。该基于Python的工具包旨在简化多智能体系统的构建、管理和部署流程,被视为AI代理开发领域的重要突破。 大会首日,谷歌还推出了全新的推理模型Gemini 2.5 Flash,很快将向公众开放。与Gemini 2.5 Pro不同,该模型在提供强大性能的同时更注重效率,允许开发者根据查询复杂性动态调整处理时间,从而在速度、准确性和成本之间实现灵活平衡,尤其适用于高流量和实时性要求的商业场景,例如客户服务和文档解析。此外,谷歌宣布计划于第三季度开始支持Gemini模型的本地部署,进一步满足企业对数据管理和合规性的需求。 在工具层面,谷歌云Vertex AI平台迎来重大更新,新增视频、图像、语音和音乐生成AI工具,其中Veo2视频生成模型新增编辑和相机控制功能,Imagen 3图像生成模型则显著提升了对象移除的自然效果。更值得关注的是,谷歌发布了全新的开放协议Agent2Agent (A2A),旨在连接不同生态系统中的AI Agents,实现跨平台智能体之间的无缝通信和协作,有望大幅降低集成成本并提升企业生产力。A2A协议基于HTTP、SSE和JSON-RPC等现有流行标准构建,旨在降低部署难度,并易于集成到企业现有的IT架构中。 图表3:视频生成类AI应用活跃度 视频生成类应用中,Sora、Runway均有小幅下降,可灵国内版因域名更新,原网站流量下降。 谷歌发布TPUv7,强化AI推理与能效优势 谷歌公司在其Cloud Next 25大会上正式发布了其第七代张量处理单元(TPU),产品代号为Ironwood (TPU v7)。此举标志着谷歌在人工智能定制硬件领域的持续投入和迭代,Ironwood被定位为该公司迄今性能最强、可扩展性最佳且能源效率最高的AI加速器。 该产品的推出,预计将对谷歌自身的AI服务能力以及其云业务的竞争力产生重要影响。 Ironwood的一个核心战略转变在于其首次被明确设计为主要面向AI推理(Inference)工作负载。谷歌方面强调,这款芯片旨在驱动需要复杂“思考”和主动生成洞察的下一代AI模型,以迎接其定义的“推理时代”(age of inference)。这一定位意味着Ironwood在架构上针对大型语言模型(LLMs)、混合专家模型(MoEs)以及其他需要大规模并行处理和高效内存访问的先进推理任务进行了深度优化。同时,通过增强的SparseCore单元,Ironwood扩展了对超大规模嵌入处理的支持能力,应用范围从传统的推荐、排序系统延伸至金融分析和科学计算等新领域,拓宽了其潜在市场。 图表4:TPUv7 Pod FP8性能显著提升 图表5:TPUv7 HBM容量提升至192GB 性能规格方面,Ironwood展现了显著的提升。其系统级设计支持通过高速芯片间互联(ICI)网络构建高达9,216颗芯片的液冷集群(Pod),据称可提供高达42.5 Exaflops的峰值FP8算力,在理论算力上远超现有公开的超级计算机系统。在单芯片层面,高带宽内存(HBM)容量大幅提升至192GB,达到上一代Trillium (TPU v6)的6倍;HBM带宽也相应提高至7.2 TBps,是Trillium的4.5倍。这些内存子系统的升级对于有效处理日益增长的模型参数量和数据吞吐量至关重要。 尤为值得关注的是Ironwood在能源效率方面的进步。根据谷歌公布的数据,其性能功耗比(Perf/Watt)相较Trillium提升了接近2倍,相较于2018年发布的首款Cloud TPU (v2),能效提升近30倍。在当前数据中心普遍面临能源供应和散热挑战的背景下,能效的显著改善不仅有助于降低大规模AI部署的运营成本(TCO),也可能成为其在市场竞争中的一个差异化优势,尤其对于注重可持续发展的客户具有吸引力。 综合来看,Ironwood的发布是谷歌在AI基础设施领域,特别是面向未来推理密集型应用场景的关键布局。通过在计算能力、内存规格和能源效率等多个维度实现显著提升,谷歌旨在为其内部需求和Google Cloud客户提供一个强大且经济高效的平台,以满足下一代人工智能模型所带来的指数级增长的算力需求。该产品的推出无疑将进一步加剧AI加速器市场的竞争,并可能巩固谷歌作为端到端AI解决方案提供商的市场地位。根据谷歌的计划,Ironwood预计将在2025年晚些时候正式向市场提供。 存储现货本周横盘调整 持续的关税争端给存储市场带来显著不确定性。虽然新季度价格谈判已在进行,但最终定价不明朗。现货市场交易放缓,短期供需平稳,但潜在风险不容忽视。终端电子产品制造商正评估关税影响,担心成本上升导致售价提高、销量下滑。这种压力预期将传导至上游存储芯片,抑制未来的备货需求。 图表6:本周存储现货行情 联发科发布新一代天玑9400+芯片 4月11日,联发科在天玑开发者大会上发布了新一代5G智能体AI移动芯片天玑9400+。 天玑9400+采用第二代全大核架构,8核CPU包含1个主频高达3.73GHz的Arm Cortex-X925超大核,以及3个Cortex-X4超大核和4个Cortex-A720大核。天玑9400+集成MediaTek第八代AI处理器NPU 890,端侧率先支持DeepSeek-R1推理模型四大关键技术,同时率先支持增强型推理解码技术(SpD+),智能体AI任务的推理速度可提升20%。 MediaTek天玑9400+搭载12核Arm GPU Immortalis-G925,支持天玑OMM追光引擎和天玑倍帧技术。 相比于PC设备,手机硬件提升的空间有限,在已有的硬件框架里提升效率能更加有效的推动端侧AI的发展。联发科在天玑9400+里对NPU的开发是值得关注的。此前手机SoC中虽然NPU可以帮助端侧设备完成一些推理任务,但大多数任务仍是由SoC中的GPU完成的。我们认为在NPU能力不断开发、模型能力不断提升的情况下,手机端侧AI开发将会加速。 图表7:联发科天玑9400+ 苹果可能于2026年发布折叠屏产品 苹果可能于2026年发布其可折叠的iPhone设备了,同时它可能还会推出一款超大的可折叠iPad。苹果发布的专利中包含了全新的铰链设计。这个设计被称为“虚拟枢轴点”,它巧妙地将转轴置于屏幕外部,极大地减少了屏幕在折叠过程中产生的折痕。同时,苹果也融入了齿轮和皮带结构,使得屏幕的开合角度能够更精确地控制。苹果还在铰链中加入了金属薄板支撑层,避免了屏幕中间出现凹陷的情况,确保了折叠屏幕的平整度和稳定性。 图表8:苹果折叠屏设计 我们认为,苹果折叠屏产品进入市场后将会促进折叠屏手机销量增长,同时带动消费者对于折叠屏产品的热情,最终推动其他消费电子厂商与产业链跟进。 图表9:中国折叠屏手机月度销量 图表10:中国折叠屏手机月度份额 风险提示 1.芯片制程发展与良率不及预期:半导体工艺的发展面临诸多挑战,主要包括技术瓶颈、良率提升难度、研发成本高企以及供应链不确定性等问题。随着工艺节点微缩变得愈发复杂,先进制程的实现难度和成本不断攀升,可能导致量产延迟,甚至影响产品性能和成本控制。此外,地缘政治风险和出口管制可能扰乱供应链,进一步拖累产能扩张。 2.中美科技领域政策恶化:中美在AI领域竞争激烈,美国限制先进芯片和半导体对中国的出口,随着竞争的加剧,未来可能会推出更严格的限制政策,限制国内AI模型的发展。 3.智能手机销量不及预期:智能手机销量与产品本身质量关系紧密,若产品本身有缺陷则智能手机销量可能收到影响。同时宏观经济变化也有可能导致消费者消费意愿发生变化从而影响智能手机销量。