行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

人工智能周报（25年第36周）：谷歌图像模型NanoBanana持续火爆，腾讯开源混元Voyager

文化传媒 2025-09-09 张伦可,陈淑媛,张昊晨,王颖婕,刘子谭国信证券申明华

核心观点与关键数据

AI相关网站流量数据：AI相关网站周访问量持续增长，第一、二、三梯队网站访问量均呈现上升趋势，新增聊天、教育类AI相关网站访问量也显著增加。
谷歌推出图像模型NanoBanana：谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini2.5FlashImage（代号NanoBanana），在角色一致性和精准编辑方面表现卓越，定价具有竞争力，每百万输出token仅30美元，单图成本约0.039美元。
OpenAI开放ChatGPTProjects功能：OpenAI将ChatGPT的Projects功能全面向免费用户开放，支持按主题创建对话文件夹、自定义指令及上传文件，便于长期管理复杂任务。
微软发布GPT-realtime：微软在AzureAIFoundry平台推出GPT-realtime语音转语音模型，显著提升语音合成自然度与交互表现力，支持图像输入，实现语音与图像的多模态对话。
亚马逊上线LensLive：亚马逊推出LensLive，支持用户通过实时视觉搜索发现商品，无需拍照或扫码，借助SageMaker和AmazonOpenSearch的服务运行支持。
苹果发布STARFlow：苹果机器学习团队推出STARFlow技术，将归一化流与自回归Transformer融合，提升效率，增强高分辨率生成能力，适合医疗影像等需严格控制内容的场景。
腾讯开源3D世界模型混元Voyager：腾讯混元官方发布并开源HunyuanWorld-Voyager（混元Voyager），是业界首个支持原生3D重建的超长漫游世界模型，可生成长距离、高保真的3D场景，并支持视频直接导出为3D格式。
美团发布LongCat-Flash-Chat：美团推出并开源LongCat-Flash-Chat，采用5600亿参数的混合专家（MoE）架构，支持大规模加速卡稳定训练，在智能体任务中表现突出。
Meta与UCSD推出DeepConf：Meta与加州大学圣地亚哥分校联合发布DeepConf技术，在AIME2025数学竞赛中与GPT-OSS-120B搭配，实现99.9%准确率，同时将计算资源消耗降低84.7%。
阿里通义发布AgentScope1.0：阿里通义实验室发布AgentScope1.0，标志其在多智能体技术开发上的新进展，提供全生命周期解决方案，包括开发、部署和监控。
行业政策：由国家互联网信息办公室、工业和信息化部等部门联合发布的《人工智能生成合成内容标识办法》正式生效，覆盖内容生成到传播的全过程，形成全链条责任体系。

投资建议

互联网整体中报业绩释放较稳健，AI主线的公司收入利润释放较强，AI已呈现对互联网巨头广告业务场景、云计算场景和企业效率方面的明显作用，典型体现在本季度腾讯广告持续保持在20%增长、阿里云增速环比提速至26%。
利润端腾讯、腾讯音乐、快手公司等经营效率提升明显。
伴随近期美股科技和A股科技的继续上涨，恒生科技指数已处于全球估值洼地，AI驱动各公司中报业绩释放，继续推荐腾讯控股、阿里巴巴、快手、美图公司，以及与宏观经济关联度较低的腾讯音乐和网易云音乐。

风险提示

政策风险，疫情反复的风险，短视频行业竞争格局恶化的风险，宏观经济下行导致广告大盘增速不及预期的风险，游戏公司新产品不能如期上线或者表现不及预期的风险等。

优于大市谷歌图像模型NanoBanana持续火爆，腾讯开源混元Voyager 核心观点行业研究·行业周报互联网·互联网Ⅱ 人工智能动态：1）产品应用：谷歌8月底推出图像模型NanoBanana，一致性强、编辑可控、速度快，社区实测与口碑热度极高；OpenAI向免费用户开放ChatGPTProjects功能，强化任务管理与隐私保护；微软发布GPT-realtime，语音与多模态交互全面升级；亚马逊上线LensLive：AI驱动实时视觉购物体验；苹果发布STAR Flow，实现归一化流与自回归Transformer结合的图像生成新突破；腾讯发布并开源3D世界模型混元Voyager；美团发布LongCat-Flash-Chat，MoE架构革新，兼顾高效推理与低成本。2）底层技术：Meta与UCSD推出DeepConf，提升推理准确率并降低算力消耗；阿里通义发布AgentScope 1.0，开源多智能体开发框架。3）行业政策：由国家互联网信息办公室、工业和信息化部等部门联合发布的《人工智能生成合成内容标识办法》正式生效。优于大市·维持证券分析师：陈淑媛021-60375431zhanglunke@guosen.com.cnchenshuyuan@guosen.com.cnS0980524030003 证券分析师：张伦可0755-81982651S0980521120004 证券分析师：王颖婕0755-81983057zhanghaochen1@guosen.com.cnwangyingjie1@guosen.com.cnS0980525020001 证券分析师：张昊晨S0980525010001 证券分析师：刘子谭liuzitan@guosen.com.cnS0980525060001 投资建议：互联网整体中报业绩释放较稳健，AI主线的公司收入利润释放较强，AI已呈现对互联网巨头广告业务场景、云计算场景和企业效率方面的明显作用，典型体现在本季度腾讯广告持续保持在20%增长、阿里云增速环比提速至26%，同时利润端腾讯、腾讯音乐、快手公司等经营效率提升明显。伴随近期美股科技和A股科技的继续上涨，我们认为恒生科技指数已处于全球估值洼地，AI驱动各公司中报业绩释放，继续推荐腾讯控股、阿里巴巴、快手、美图公司，以及与宏观经济关联度较低的腾讯音乐和网易云音乐。风险提示：政策风险，疫情反复的风险，短视频行业竞争格局恶化的风险，宏观经济下行导致广告大盘增速不及预期的风险，游戏公司新产品不能如期上线或者表现不及预期的风险等。资料来源：Wind、国信证券经济研究所整理相关研究报告《人工智能行业专题（11）：探究模型能力与应用的进展和边界》——2025-08-25《美股科技互联网25Q2财报总结：AI显著拉动云和广告需求，Capex投入商业化闭环》——2025-08-06《人工智能周报（25年第29周）-谷歌推出Gemini2.5稳定版，阿里开源Qwen3-Coder模型》——2025-07-28《英伟达H20恢复销售事件点评-Q2国产云维持高增速，H20出货预计带动国内云厂Capex上升》——2025-07-16《从Circle上市，探索稳定币与交易所的合作模式》——2025-06-24 内容目录 AI相关网站流量数据............................................................4人工智能动态：谷歌推出高性价比图像模型NanoBanana，腾讯开源3D世界模型混元Voyager..............................................................................7（一）产品应用.......................................................................7（二）底层技术.......................................................................8（三）行业政策.......................................................................8（四）重点事件预告...................................................................8投资建议......................................................................8风险提示......................................................................9 图表目录图1：AI相关网站周访问量（百万）..........................................................4图2：第一梯队AI相关网站周访问量变动（百万）.............................................5图3：第二梯队AI相关网站周访问量变动（百万）.............................................5图4：第三梯队AI相关网站周访问量变动（百万）.............................................6图5：新增聊天、教育类AI相关网站周访问量变动（百万）.....................................6 AI相关网站流量数据资料来源：Similarweb，国信证券经济研究所整理资料来源：Similarweb，国信证券经济研究所整理资料来源：Similarweb，国信证券经济研究所整理资料来源：Similarweb，国信证券经济研究所整理人工智能动态：谷歌推出高性价比图像模型NanoBanana，腾讯开源3D世界模型混元Voyager （一）产品应用谷歌推出图像模型NanoBanana。谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini2.5Flash Image（代号NanoBanana），在角色一致性和精准编辑方面表现卓越。其定价具有竞争力，每百万输出token仅30美元，单图成本约0.039美元，低于OpenAI同类产品每百万token 40美元定价。该模型支持多图合成、多轮次修改与风格迁移，并内置安全机制应对深度伪造图像。9月3日，谷歌还发布了官方Prompt模板，支持多种风格生成，降低用户使用门槛。 OpenAI向免费用户开放ChatGPTProjects功能，强化任务管理与隐私保护。9月4日，OpenAI在其官方X账号上宣布将ChatGPT的Projects功能全面向免费用户开放，标志着功能普及与用户体验的重要提升。Projects相当于智能工作区，支持按主题创建对话文件夹、自定义指令及上传文件，便于长期管理复杂任务。此举既满足超八成免费用户的需求，也契合OpenAI的“免费增值”策略，吸引更多人体验高级功能并推动付费转化。未来，Projects将扩展至iOS并可能加入语音交互等工具。微软发布GPT-realtime，语音与多模态交互全面升级。9月5日，据搜狐新闻报道，微软在AzureAIFoundry平台正式推出GPT-realtime语音转语音模型，显著提升语音合成自然度与交互表现力。该模型整合更精准的指令跟随、更高音频质量及自然语言处理能力，并新增Marin和Cedar两种语音选项。开发者可通过Real-timeAPI便捷接入，加速应用开发。GPT-realtime还支持图像输入，实现语音与图像的多模态对话，拓展应用场景。相比预览版gpt-4o-realtime，新版本价格下调20%，按百万token计费，降低了开发者成本，助力语音与多模态应用的普及。亚马逊上线LensLive：AI驱动实时视觉购物体验。9月3日，据TechCrunch报道，亚马逊推出LensLive，作为AmazonLens的AI升级版，支持用户通过实时视觉搜索发现商品，无需拍照或扫码。该功能借助SageMaker和AmazonOpenSearch的服务运行支持，能在用户镜头下即时生成匹配商品滑动列表。苹果发布STARFlow，实现归一化流与自回归Transformer结合的图像生成新突破。9月2日，AIbase报道苹果机器学习团队推出STARFlow技术，旨在与DALL-E、Midjourney等扩散模型竞争。STARFlow将归一化流与自回归Transformer融合，采用“深-浅设计”提升效率，并在潜在空间中运行以增强高分辨率生成能力。其保持归一化流的数学特性，实现精确最大似然训练，尤其适合医疗影像等需严格控制内容的场景。腾讯发布并开源3D世界模型混元Voyager。9月2日，腾讯混元官方发布并开源HunyuanWorld-Voyager（混元Voyager），是业界首个支持原生3D重建的超长漫游世界模型。该模型突破视频生成在空间一致性与范围上的限制，可生成长距离、高保真的3D场景，并支持视频直接导出为3D格式。Voyager采用3D输入—3D输出设计，与混元世界模型1.0高度兼容，进一步扩展漫游范围与复杂场景质量，并支持风格化控制与编辑。其功能涵盖视频场景重建、3D纹理生成、风格定制、深度估计等多类应用，助力VR、仿真与游戏开发。美团发布LongCat-Flash-Chat，MoE架构革新，兼顾高效推理与低成本。9月1日，美团在其官网正式推出并开源LongCat-Flash-Chat，该模型采用5600亿参数的混合专家（MoE）架构，通过快捷连接MoE（ScMoE）与底层优化，该模型突破传统通信瓶颈，支持大规模加速卡稳定训练。采用“非思考型”设计，LongCat-Flash-Chat在智能体任务中表现突出，特别适合长时序、复杂流程场景。（二）底层技术 Meta与UCSD推出DeepConf，提升推理准确率并降低算力消耗。9月1日，根据搜狐新闻消息，Meta与加州大学圣地亚哥分校联合发布DeepConf技术，在AIME2025数学竞赛中与GPT-OSS-120B搭配，实现99.9%准确率，同时将计算资源消耗降低84.7%。DeepConf设计了五种全新的“探针”（令牌、组、尾部、最低组、底部百分位置信度），实时监控AI的“心理状态”，精细化把控推理质量，并提供离线与在线两种工作模式。尤其在在线模式下，模型能在低置信度时提前终止并切换路径，从而降低延迟与成本，同时保持极高性能。阿里通义发布AgentScope1.0，开源多智能体开发框架。9月2日，阿里通义实验室在其官微正式发布AgentScope1.0，标志其在多智能体技术开发上的新进展。提供全生命周期解决方案，包括开发、部署和监控。其三层技术架构（核心框架、Runtime和Studio）支持独立使用，具备实时介入控制、智能上下文管理和高效工具调用三大能力，确保了智能体的安全性和运行效率。（三）行业政策 9月1日，由国家互联网信息办公室、工业和信息化部等部门联合发布的《人工智能生成合成内容标识办法》（以下简称《办法》），与配套强制性国家标准《网络安全技术人工智能生成合成内容标识方法》正式生效。《办法》的意义不仅在于对生成合成服务提供者（如模型开发者）提出标识要求，还对内容传播服务提供者（如社交媒体平台）规定了核验和添加标识的义务。这意味着监管责任覆盖了内容生成到传播的全过程，形成全链条责任体系，有助于从源头到终端对AI生成内容进行有效管理，而且给国际社会提供了AI生成内容治理的一个范例。（四）重点事件预告 9月17日：2025全球AI芯片峰会（GACS20

点击免费查看完整报告

人工智能周报（25年第36周）：谷歌图像模型NanoBanana持续火爆，腾讯开源混元Voyager

核心观点与关键数据

投资建议

风险提示

你可能感兴趣

人工智能周报（25年第20周）：腾讯发布混元图像2.0等多个新模型，国内两款AI产品月活破亿

人工智能周报（25年第32周）：OpenAI发布GPT5，腾讯混元开源多个小尺寸模型

人工智能周报（25年第27周）：Meta全资收购PlayAI，腾讯发布升级版混元3D-PolyGen模型

全球科技行业周报：OpenAI发布视频与音频生成模型Sora2，腾讯混元图像3.0开源并登顶

传媒行业周报：阿里开源全能视频模型腾讯发布混元图像2.0模型

人工智能周报（24年第36周）：多款AI独立APP上线，腾讯发布新一代大模型“混元Turbo”

互联网行业人工智能周报（25年第29周）：谷歌推出Gemini 2.5稳定版，阿里开源Qwen3-Coder模型

人工智能周报（25年第49周）：DeepSeek-V3.2正式版发布，腾讯自研AI大模型混元2.0上线

传媒行业周观察（20250825-20250829）：阿里云收入高增、谷歌推出AI图像模型NanoBanana出圈，继续看好AI应用从预期走向兑现

121305腾讯混元发布混元图像30图生图模型财联社1月26日电腾讯

人工智能周报（25年第36周）：谷歌图像模型NanoBanana持续火爆，腾讯开源混元Voyager

你可能感兴趣

人工智能周报（25年第20周）：腾讯发布混元图像2.0等多个新模型，国内两款AI产品月活破亿

人工智能周报（25年第32周）：OpenAI发布GPT5，腾讯混元开源多个小尺寸模型

人工智能周报（25年第27周）：Meta全资收购PlayAI，腾讯发布升级版混元3D-PolyGen模型

全球科技行业周报：OpenAI发布视频与音频生成模型Sora2，腾讯混元图像3.0开源并登顶

传媒行业周报：阿里开源全能视频模型 腾讯发布混元图像2.0模型

人工智能周报（24年第36周）：多款AI独立APP上线，腾讯发布新一代大模型“混元Turbo”

互联网行业人工智能周报（25年第29周）：谷歌推出Gemini 2.5稳定版，阿里开源Qwen3-Coder模型

人工智能周报（25年第49周）：DeepSeek-V3.2正式版发布，腾讯自研AI大模型混元2.0上线

传媒行业周观察（20250825-20250829）：阿里云收入高增、谷歌推出AI图像模型NanoBanana出圈，继续看好AI应用从预期走向兑现

121305腾讯混元发布混元图像30图生图模型财联社1月26日电腾讯

传媒行业周报：阿里开源全能视频模型腾讯发布混元图像2.0模型