AI智能总结
优于大市 谷歌图像模型NanoBanana持续火爆,腾讯开源混元Voyager 核心观点 行业研究·行业周报 互联网·互联网Ⅱ 人工智能动态:1)产品应用:谷歌8月底推出图像模型NanoBanana,一致性强、编辑可控、速度快,社区实测与口碑热度极高;OpenAI向免费用户开放ChatGPTProjects功能,强化任务管理与隐私保护;微软发布GPT-realtime,语音与多模态交互全面升级;亚马逊上线LensLive:AI驱动实时视觉购物体验;苹果发布STAR Flow,实现归一化流与自回归Transformer结合的图像生成新突破;腾讯发布并开源3D世界模型混元Voyager;美团发布LongCat-Flash-Chat,MoE架构革新,兼顾高效推理与低成本。2)底层技术:Meta与UCSD推出DeepConf,提升推理准确率并降低算力消耗;阿里通义发布AgentScope 1.0,开源多智能体开发框架。3)行业政策:由国家互联网信息办公室、工业和信息化部等部门联合发布的《人工智能生成合成内容标识办法》正式生效。 优于大市·维持 证券分析师:陈淑媛021-60375431zhanglunke@guosen.com.cnchenshuyuan@guosen.com.cnS0980524030003 证券分析师:张伦可0755-81982651S0980521120004 证券分析师:王颖婕0755-81983057zhanghaochen1@guosen.com.cnwangyingjie1@guosen.com.cnS0980525020001 证券分析师:张昊晨S0980525010001 证券分析师:刘子谭liuzitan@guosen.com.cnS0980525060001 投资建议:互联网整体中报业绩释放较稳健,AI主线的公司收入利润释放较强,AI已呈现对互联网巨头广告业务场景、云计算场景和企业效率方面的明显作用,典型体现在本季度腾讯广告持续保持在20%增长、阿里云增速环比提速至26%,同时利润端腾讯、腾讯音乐、快手公司等经营效率提升明显。伴随近期美股科技和A股科技的继续上涨,我们认为恒生科技指数已处于全球估值洼地,AI驱动各公司中报业绩释放,继续推荐腾讯控股、阿里巴巴、快手、美图公司,以及与宏观经济关联度较低的腾讯音乐和网易云音乐。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。 资料来源:Wind、国信证券经济研究所整理 相关研究报告 《人工智能行业专题(11):探究模型能力与应用的进展和边界》——2025-08-25《美股科技互联网25Q2财报总结:AI显著拉动云和广告需求,Capex投入商业化闭环》——2025-08-06《人工智能周报(25年第29周)-谷歌推出Gemini2.5稳定版,阿里开源Qwen3-Coder模型》——2025-07-28《英伟达H20恢复销售事件点评-Q2国产云维持高增速,H20出货预计带动国内云厂Capex上升》——2025-07-16《从Circle上市,探索稳定币与交易所的合作模式》——2025-06-24 内容目录 AI相关网站流量数据............................................................4人工智能动态:谷歌推出高性价比图像模型NanoBanana,腾讯开源3D世界模型混元Voyager..............................................................................7(一)产品应用.......................................................................7(二)底层技术.......................................................................8(三)行业政策.......................................................................8(四)重点事件预告...................................................................8投资建议......................................................................8风险提示......................................................................9 图表目录 图1:AI相关网站周访问量(百万)..........................................................4图2:第一梯队AI相关网站周访问量变动(百万).............................................5图3:第二梯队AI相关网站周访问量变动(百万).............................................5图4:第三梯队AI相关网站周访问量变动(百万).............................................6图5:新增聊天、教育类AI相关网站周访问量变动(百万).....................................6 AI相关网站流量数据 资料来源:Similarweb,国信证券经济研究所整理 资料来源:Similarweb,国信证券经济研究所整理 资料来源:Similarweb,国信证券经济研究所整理 资料来源:Similarweb,国信证券经济研究所整理 人工智能动态:谷歌推出高性价比图像模型NanoBanana,腾讯开源3D世界模型混元Voyager (一)产品应用 谷歌推出图像模型NanoBanana。谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini2.5Flash Image(代号NanoBanana),在角色一致性和精准编辑方面表现卓越。其定价具有竞争力,每百万输出token仅30美元,单图成本约0.039美元,低于OpenAI同类产品每百万token 40美元定价。该模型支持多图合成、多轮次修改与风格迁移,并内置安全机制应对深度伪造图像。9月3日,谷歌还发布了官方Prompt模板,支持多种风格生成,降低用户使用门槛。 OpenAI向免费用户开放ChatGPTProjects功能,强化任务管理与隐私保护。9月4日,OpenAI在其官方X账号上宣布将ChatGPT的Projects功能全面向免费用户开放,标志着功能普及与用户体验的重要提升。Projects相当于智能工作区,支持按主题创建对话文件夹、自定义指令及上传文件,便于长期管理复杂任务。此举既满足超八成免费用户的需求,也契合OpenAI的“免费增值”策略,吸引更多人体验高级功能并推动付费转化。未来,Projects将扩展至iOS并可能加入语音交互等工具。 微软发布GPT-realtime,语音与多模态交互全面升级。9月5日,据搜狐新闻报道,微软在AzureAIFoundry平台正式推出GPT-realtime语音转语音模型,显著提升语音合成自然度与交互表现力。该模型整合更精准的指令跟随、更高音频质量及自然语言处理能力,并新增Marin和Cedar两种语音选项。开发者可通过Real-timeAPI便捷接入,加速应用开发。GPT-realtime还支持图像输入,实现语音与图像的多模态对话,拓展应用场景。相比预览版gpt-4o-realtime,新版本价格下调20%,按百万token计费,降低了开发者成本,助力语音与多模态应用的普及。 亚马逊上线LensLive:AI驱动实时视觉购物体验。9月3日,据TechCrunch报道,亚马逊推出LensLive,作为AmazonLens的AI升级版,支持用户通过实时视觉搜索发现商品,无需拍照或扫码。该功能借助SageMaker和AmazonOpenSearch的服务运行支持,能在用户镜头下即时生成匹配商品滑动列表。 苹果发布STARFlow,实现归一化流与自回归Transformer结合的图像生成新突破。9月2日,AIbase报道苹果机器学习团队推出STARFlow技术,旨在与DALL-E、Midjourney等扩散模型竞争。STARFlow将归一化流与自回归Transformer融合,采用“深-浅设计”提升效率,并在潜在空间中运行以增强高分辨率生成能力。其保持归一化流的数学特性,实现精确最大似然训练,尤其适合医疗影像等需严格控制内容的场景。 腾讯发布并开源3D世界模型混元Voyager。9月2日,腾讯混元官方发布并开源HunyuanWorld-Voyager(混元Voyager),是业界首个支持原生3D重建的超长漫游世界模型。该模型突破视频生成在空间一致性与范围上的限制,可生成长距离、高保真的3D场景,并支持视频直接导出为3D格式。Voyager采用3D输入—3D输出设计,与混元世界模型1.0高度兼容,进一步扩展漫游范围与复杂 场景质量,并支持风格化控制与编辑。其功能涵盖视频场景重建、3D纹理生成、风格定制、深度估计等多类应用,助力VR、仿真与游戏开发。 美团发布LongCat-Flash-Chat,MoE架构革新,兼顾高效推理与低成本。9月1日,美团在其官网正式推出并开源LongCat-Flash-Chat,该模型采用5600亿参数的混合专家(MoE)架构,通过快捷连接MoE(ScMoE)与底层优化,该模型突破传统通信瓶颈,支持大规模加速卡稳定训练。采用“非思考型”设计,LongCat-Flash-Chat在智能体任务中表现突出,特别适合长时序、复杂流程场景。 ( 二 )底层技术 Meta与UCSD推出DeepConf,提升推理准确率并降低算力消耗。9月1日,根据搜狐新闻消息,Meta与加州大学圣地亚哥分校联合发布DeepConf技术,在AIME2025数学竞赛中与GPT-OSS-120B搭配,实现99.9%准确率,同时将计算资源消耗降低84.7%。DeepConf设计了五种全新的“探针”(令牌、组、尾部、最低组、底部百分位置信度),实时监控AI的“心理状态”,精细化把控推理质量,并提供离线与在线两种工作模式。尤其在在线模式下,模型能在低置信度时提前终止并切换路径,从而降低延迟与成本,同时保持极高性能。 阿里通义发布AgentScope1.0,开源多智能体开发框架。9月2日,阿里通义实验室在其官微正式发布AgentScope1.0,标志其在多智能体技术开发上的新进展。提供全生命周期解决方案,包括开发、部署和监控。其三层技术架构(核心框架、Runtime和Studio)支持独立使用,具备实时介入控制、智能上下文管理和高效工具调用三大能力,确保了智能体的安全性和运行效率。 (三)行业政策 9月1日,由国家互联网信息办公室、工业和信息化部等部门联合发布的《人工智能生成合成内容标识办法》(以下简称《办法》),与配套强制性国家标准《网络安全技术人工智能生成合成内容标识方法》正式生效。《办法》的意义不仅在于对生成合成服务提供者(如模型开发者)提出标识要求,还对内容传播服务提供者(如社交媒体平台)规定了核验和添加标识的义务。这意味着监管责任覆盖了内容生成到传播的全过程,形成全链条责任体系,有助于从源头到终端对AI生成内容进行有效管理,而且给国际社会提供了AI生成内容治理的一个范例。 (四)重点事件预告 9月17日:2025全球AI芯片峰会(GACS20