您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [第一上海证券]:AI 大模型周报 - 发现报告

AI 大模型周报

信息技术 2025-11-14 李京霖,李倩,陈晓霞 第一上海证券 车伟光
报告封面

【行业评论】 AI大模型周报 李京霖852-25321957Jinglin.li@firstshanghai.com.hk GPT:OpenAI发布GPT-5.1 11月12日,OpenAI正式官宣推出新一代旗舰模型GPT-5.1系列,官方表示此次升级旨在“让ChatGPT更智能,对话体验更有趣”。此次发布距上一代GPT-5仅数月时间,根据官方公告,GPT-5.1系列包含GPT-5.1 Instant和GPT-5.1 Thinking两大核心模型,同步推出GPT-5.1 Auto智能功能,即日起向付费用户逐步推送,免费用户将在付费用户覆盖完成后跟进。 李倩852-25321539Chuck.li@firstshanghai.com.hk 陈晓霞852-25321956xx.chen@firstshanghai.com.hk GPT-5.1 Instant新增“自适应推理”机制,成为首个引入思维链(CoT)的轻量化模型,能自主判断问题复杂度,简单查询保持极速响应,复杂任务则自动投入深度思考,同时其语气更显亲切健谈。 GPT-5.1 Thinking则实现了思考节奏的智能调节,简单任务响应速度较前代提升两倍,复杂问题则延长思考周期输出详尽答案,且大幅减少专业术语与晦涩表达,非技术人员也能轻松理解复杂概念。 行业TMT GPT-5.1 Auto将为每个查询自动选择最适合的模型,因此在大多数情况下无需手动选择。 Gemini:谷歌疑似即将推出Gemini 3 Pro和Nano Banana 2 11月7日,有消息爆料称谷歌正准备推出两款新一代AI模型:其中Gemini 3主打代码生成与通用任务,Nano Banana 2则专注于生成高质量图像。博主Testing Catalog News在X上公布:名为Gemini-3-pro的模型已出现在谷歌的云平台Vertex AI上。该平台是谷歌为开发AI智能体与AI应用提供的核心服务,进一步印证了Gemini 3将在11月发布的传闻。模型的内部名称为“gemini-3-pro-preview-11-2025”。 除了Gemini 3,谷歌还在测试另一款代号为“GEMPIX2”的图像模型Nano Banana 2,被视为谷歌最先进的AI图像生成系统之一。11月9日有网友发现Nano Banana2已在第三方平台Media IO上现身。从测试中了解到,Nano Banana 2具备原生2K分辨率,可选4K超分;生成复杂场景仅需10秒;提示词响应更精准。目前Media IO平台上NB2的入口已经关闭。 豆包:字节跳动发布了Doubao-Seed-Code编程模型 11月11日,字节跳动发布了Doubao-Seed-Code模型,一款专门面向Agentic Coding任务优化的编程模型。原生支持256k上下文,可以轻松处理大型代码文件和复杂模块依赖场景,并支持视觉理解,根据UI设计图、截图自动生成高保真页面代码。兼容各种API接口(OpenAI & Anthropic)、IDE以及CLI。比如,可以在ClaudeCode里无缝接入。其能力背后是基于一套大规模Agent强化学习系统,无需冷启动数据,完全依赖端到端强化学习, Lite套餐适合大多数开发者,首购首月¥9.9,续费¥40/月;Pro套餐适合复杂开发项目,首购首月¥49.9,续费¥200/月。 API采用分层定价:0-32k输入区间:输入1.20元/百万Tokens,输出8.00元/百万Tokens32-128k输入区间:输入1.40元/百万Tokens,输出12.00元/百万Tokens128-256k输入区间:输入2.80元/百万Tokens,输出16.00元/百万Tokens Qwen:通义千问推出Qwen3-Max-Thinking预览版 11月4日,阿里通义千问推出Qwen3-Max-Thinking的早期预览版,并表示:欢迎大家尝鲜试用。据介绍,Qwen3-Max推理模型仍在持续训练中,当借助工具调用和规模化的测试时计算时,模型可在AIME 25和HMMT25等具有挑战性的数学推理基准测试中达到100%的准确率。此前是于9月发布了Qwen3-Max,其特点是总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了global-batch load balancing loss。预训练loss稳定平滑、没有使用训练回退、改变数据分布等调整策略。Qwen3-Max-Base训练效率显著提升,使用ChunkFlow策略获得了相比序列并行方案提升3倍的吞吐收益,支持Qwen3-Max 1M长上下文的训练。同时,通过SanityCheck、EasyCheckpoint、调度链路优化等多种手段,Qwen3-Max在超大规模集群上因硬件故障造成的时间损失下降为Qwen2.5-Max的五分之一。 大模型排行榜: 以下是本季度各个大模型在文本与文转视频方面的盲测排行 披露事项与免责声明 披露事项 免责声明 本报告由第一上海证券有限公司(“第一上海”)编制,仅供机构投资者一般审阅。未经第一上海事先明确书面许可,就本报告之任何材料、内容或印本,不得以任何方式复制、摘录、引用、更改、转移、传输或分发给任何其他人。本报告所载的资料、工具及材料只提供给阁下作参考之用,并非作为或被视为出售或购买或认购证券或其它金融票据,或就其作出要约或要约邀请,也不构成投资建议。阁下不可依赖本报告中的任何内容作出任何投资决策。本报告及任何资料、材料及内容并未有考虑到个别的投资者的特定投资目标、财务情况、风险承受能力或任何特别需要。阁下应综合考虑到本身的投资目标、风险评估、财务及税务状况等因素,自行作出本身独立的投资决策。 本报告所载资料及意见来自第一上海认为可靠的来源取得或衍生,但对于本报告所载预测、意见和预期的公平性、准确性、完整性或正确性,并不作任何明示或暗示的陈述或保证。第一上海或其各自的董事、主管人员、职员、雇员或代理均不对因使用本报告或其内容或与此相关的任何损失而承担任何责任。对于本报告所载信息的准确性、公平性、完整性或正确性,不可作出依赖。 第一上海或其一家或多家关联公司可能或已经,就本报告所载信息、评论或投资策略,发布不一致或得出不同结论的其他报告或观点。信息、意见和估计均按“现况”提供,不提供任何形式的保证,并可随时更改,恕不另行通知。 第一上海并不是美国一九三四年修订的证券法(「一九三四年证券法」)或其他有关的美国州政府法例下的注册经纪-交易商。此外,第一上海亦不是美国一九四零年修订的投资顾问法(下简称为「投资顾问法」,「投资顾问法」及「一九三四年证券法」一起简称为「有关法例」)或其他有关的美国州政府法例下的注册投资顾问。在没有获得有关法例特别豁免的情况下,任何由第一上海提供的经纪及投资顾问服务,包括(但不限于)在此档内陈述的内容,皆没有意图提供给美国人。此档及其复印本均不可传送或被带往美国、在美国分发或提供给美国人。 在若干国家或司法管辖区,分发、发行或使用本报告可能会抵触当地法律、规定或其他注册/发牌的规例。本报告不是旨在向该等国家或司法管辖区的任何人或单位分发或由其使用。 ©2025第一上海证券有限公司版权所有。保留一切权利。 第一上海证券有限公司香港中环德辅道中71号永安集团大厦19楼电话:(852) 2522-2101传真:(852) 2810-6789网址:Http://www.myStockhk.com第一上海证券有限公司香港中环德辅道中71号永安集团大厦19楼电话:(852) 2522-2101传真:(852) 2810-6789网址:Http://www.myStockhk.com