您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [第一上海证券]:AI大模型周报 - 发现报告

AI大模型周报

信息技术 2025-09-30 李京霖,李倩,陈晓霞 第一上海证券 严宏志19905053625
报告封面

【行业评论】 AI 大模型周报 李京霖852-25321957Jinglin.li@firstshanghai.com.hk Llama:Meta 向美国盟国开放 Llama 人工智能模型 9 月 24 日,Meta 平台公司将其开源 Llama 人工智能模型的访问权限扩展至多个欧洲和亚洲的美国盟国,以支持关键合作伙伴国家的国家安全计划。在已对美国及其现有情报共享伙伴(加拿大、澳大利亚、新西兰和英国)开放的基础上,Llama 的可用范围将延伸至法国、德国、意大利、日本、韩国以及北约和欧盟等关键机构。公司透露已与亚马逊云科技、微软、谷歌云、IBM、甲骨文、Palantir、埃森哲和Anduril 等多家科技及国防企业建立合作,以支持在选定国家的部署。Llama 的开源特性允许各国政府在本地安全环境中部署模型,利用敏感数据进行微调,且无需通过第三方 AI 服务商路由信息。 李倩852-25321539Chuck.li@firstshanghai.com.hk 陈晓霞852-25321956xx.chen@firstshanghai.com.hk 行业TMT ChatGPT:OpenAI 发布了名为 GDPval 的全新基准测试;推出 ChatGPT Pulse 9 月 26 日,OpenAI 发布了一项新的基准测试,用于比较其 AI 模型与各行业专业人士的工作表现。这项名为 GDPval 的全新基准测试,设计理念涵盖美国 GDP 贡献最大的九大产业,从医疗、金融、制造业到政府部门等广泛领域锁定 44 种不同的职业,从软体工程师、护士到媒体记者,力求模拟真实世界中的专业工作场景。测试结果显示,其最新一代模型 GPT-5-high(高算力版本)准确率为 40.6%。其主要竞争对手 Anthropic 公司的 ClaudeOpus 4.1 模型则为 49%,在首轮测试中略胜一筹。OpenAI 对此解释称,部分原因是 Claude 在生成图表时的视觉美观度更高,而非纯粹的效能领先。OpenAI 评估负责人 Tejal Patwardhan 透露,仅仅 15 个月前发布的 GPT-4o 模型,其准确率仅为 13.7%,而GPT-5 的成绩几乎提升了 3 倍。预示着未来 AI 在专业领域的表现将持续快速提升。 9 月 27 日,OpenAI 正式推出 ChatGPT 内置新功能 Pulse,该功能可在用户睡眠期间自动生成个性化报告。Pulse 每天为用户提供 5-10 份简报,帮助用户快速了解当天重要信息,旨在鼓励用户将 ChatGPT 作为早晨第一时间查看的应用。Pulse 更倾向于异步为用户工作,而不是仅仅回应问题。通过Pulse,OpenAI显然希望ChatGPT 变得更加主动。OpenAI 将向月费200 美元的 Pro 计划订阅者推出 Pulse,该功能将在 ChatGPT 应用中作为新标签页出现。公司表示希望未来向所有 ChatGPT用户推出 Pulse,Plus 订阅者将很快获得访问权限。 Claude:Anthropic 推出 Claude Sonnet 4.5 9 月 29 日,Anthropic 公布了其最新的人工智能模型:Claude Sonnet 4.5。Anthropic 表示,该模型更擅长编码、使用计算机和满足实际业务需求,并且在网络安全、金融和研究等专业领域表现出色。Anthropic 表示,根据 SWE-bench Verified(一套衡量人工智能系统软件编码能力的测试集)等行业基准,Claude Sonnet4.5 是“世界上最好的编码模型”。该模型可以生成更高质量的代码,更好地识别代码改进,并且可以更可靠地遵循指令。 Claude Sonnet 4.5 可以自主运行 30小时,能够在整个运行过程中保持对复杂、多步骤任务的专注。公司 5 月份推出 的 Claude Opus 4 只能自主运行 7 小时。 DeepSeek:发布 DeepSeek-V3.2-Exp 模型 9 月 30 日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性( Experimental ) 的 版本 。 作 为 迈 向 新 一 代 架 构 的 中 间 步 骤 ,V3.2-Exp在V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API 大幅度降价。DeepSeek Sparse Attention(DSA) 首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 Gemini:谷歌推出推出 GeminiRobotics 1.5 系列 9 月 27 日,谷歌推出了两款能够通过高级思维解锁智能体体验的模型,GeminiRobotics 1.5 与 Gemini Robotics-ER 1.5,为机器人打开物理智能体的时代。机器人不仅能感知世界,还能规划、推理、使用工具并自主行动,从而解决那些以往对机器人来说几乎不可能的复杂、多步骤任务。其中,具身推理模型GeminiRobotics-ER 1.5 在物理环境中的规划与逻辑决策上表现突出,具备最先进的空间理解能力,能以自然语言交互、估计自己的成功率和进度、原生调用工具。随后,Gemini Robotics-ER 1.5 会将自然语言的逐步指令传递给 Gemini Robotics 1.5,后者再利用其视觉和语言理解直接执行具体动作。目前 GeminiRobotics-ER 1.5 已通过 Google AI Studio的 Gemini API 向开发者开放;而 GeminiRobotics1.5目前则仅对部分合作伙伴开放。 Grok: xAI 与美国总务管理局达成合作 9 月 25 日,美国总务管理局 (GSA) 宣布与 xAI 达成一项重要 OneGov 协议,允许联邦机构以每家机构 0.42 美元的价格访问 Grok AI 模型,有效期 18 个月。协议涵盖 Grok 4 和 Grok 4 Fast,xAI 还将派遣专职工程师协助参与机构快速有效地将这些 AI 工具应用到其工作流程中。美国联邦采购服务局局长乔希·格伦鲍姆表示: “广泛使用先进的人工智能模型对于构建纳税人应得的高效、负责的政府至关重要,也有利于兑现特朗普总统关于美国将赢得全球人工智能竞赛的承诺。我们重视 xAI 与 GSA 的合作,并派遣工程师加速采用 Grok 来转变政府运营方式。” 豆包:奔驰深化与字节跳动的合作,将豆包 AI 集成到车辆中 9 月 23 日,梅赛德斯-奔驰集团与北京字节跳动举行了签约仪式。此次签约是自 2023 年与火山引擎合作以来,梅赛德斯-奔驰与字节跳动合作的进一步深化。首款搭载豆包大模型的奔驰车型——全新纯电 CLA,计划于今年秋季在中国市场上市。合作内容包括大语言模型、多模态模型及生成式人工智能等技术,并整合导航、娱乐、生活服务等功能,以提升座舱系统的个性化体验。火山引擎的“AI 云原生”算法能力也将为奔驰的智能化研发提供技术支持。在研发环节,火山引擎将协助梅赛德斯-奔驰构建大数据平台,结合 AI 大模型与数据分析能力,助力研发流程的数字化协同,提高研发效率。 Mistral:Mistral 首席执行官强调将人工智能开发转移到企业 9 月 26 日, Mistral 首席执行官 Arthur Mensch 表示:“过去三年,我们已经能够压缩人类知识,并全面提升模型能力。但现在我们已经达到了饱和点,这意味着下一个前沿领域是进入一种新型环境。”为了满足模型对高质量公共数据的需求,Mistral 的方法是与企业建立合作伙伴关系,利用专有数据进一步训练现有模型。 本报告不可对加拿大、日本、美国地区及美国国籍人士发放 披露事项与免责声明 披露事项 免责声明 本报告由第一上海证券有限公司(“第一上海”)编制,仅供机构投资者一般审阅。未经第一上海事先明确书面许可,就本报告之任何材料、内容或印本,不得以任何方式复制、摘录、引用、更改、转移、传输或分发给任何其他人。本报告所载的资料、工具及材料只提供给阁下作参考之用,并非作为或被视为出售或购买或认购证券或其它金融票据,或就其作出要约或要约邀请,也不构成投资建议。阁下不可依赖本报告中的任何内容作出任何投资决策。本报告及任何资料、材料及内容并未有考虑到个别的投资者的特定投资目标、财务情况、风险承受能力或任何特别需要。阁下应综合考虑到本身的投资目标、风险评估、财务及税务状况等因素,自行作出本身独立的投资决策。 本报告所载资料及意见来自第一上海认为可靠的来源取得或衍生,但对于本报告所载预测、意见和预期的公平性、准确性、完整性或正确性,并不作任何明示或暗示的陈述或保证。 第一上海或其各自的董事、主管人员、职员、雇员或代理均不对因使用本报告或其内容或与此相关的任何损失而承担任何责任。对于本报告所载信息的准确性、公平性、完整性或正确性,不可作出依赖。 第一上海或其一家或多家关联公司可能或已经,就本报告所载信息、评论或投资策略,发布不一致或得出不同结论的其他报告或观点。 信息、意见和估计均按“现况”提供,不提供任何形式的保证,并可随时更改,恕不另行通知。 第一上海并不是美国一九三四年修订的证券法(「一九三四年证券法」)或其他有关的美国州政府法例下的注册经纪-交易商。此外,第一上海亦不是美国一九四零年修订的投资顾问法(下简称为「投资顾问法」,「投资顾问法」及「一九三四年证券法」一起简称为「有关法例」)或其他有关的美国州政府法例下的注册投资顾问。在没有获得有关法例特别豁免的情况下,任何由第一上海提供的经纪及投资顾问服务,包括(但不限于)在此档内陈述的内容,皆没有意图提供给美国人。此档及其复印本均不可传送或被带往美国、在美国分发或提供给美国人。 在若干国家或司法管辖区,分发、发行或使用本报告可能会抵触当地法律、规定或其他注册/发牌的规例。本报告不是旨在向该等国家或司法管辖区的任何人或单位分发或由其使用。 ©2025 第一上海证券有限公司 版权所有。保留一切权利。 第一上海证券有限公司香港中环德辅道中 71 号永安集团大厦 19 楼电话:(852) 2522-2101传真:(852) 2810-6789网址:Http://www.myStockhk.com第一上海证券有限公司香港中环德辅道中 71 号永安集团大厦 19 楼电话:(852) 2522-2101传真:(852) 2810-6789网址:Http://www.myStockhk.com