行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI 大模型周报

信息技术 2025-08-12 第一上海证券王泰华

行业评论：AI大模型周报

Llama

Meta Platforms的TBD实验室正在牵头开发最新版本的大语言模型Llama。
项目由Jack Rae领导，内部被称为Llama4.5或Llama 4。
TBD实验室将与Meta其他AI团队合作开展项目，包括模型发布、推理能力扩展和AI代理开发。

ChatGPT

OpenAI发布最新模型GPT-5。
向所有人提供GPT-5，包括免费用户（使用上限后可用GPT-5 mini）。
Plus用户有更高使用量，Pro用户无限制访问。
模型提供400,000 tokens（输入）和128,000 tokens（输出）的上下文窗口。
测试集表现优异：HLE 30.7、GPQA 88.4、AIME25 100、LiveCodeBench 86.6（mini）。
在写作、编程和医疗保健领域表现突出。

Claude

Anthropic发布Claude Opus 4.1，升级智能体任务、现实世界编码及推理能力。
向Claude付费用户和Claude Code用户开放，并在API、亚马逊Bedrock和谷歌云Vertex AI平台上线。
多文件代码重构性能提升显著，能精准定位和修正大型代码库问题。

Gemini

DeepMind推出第三代通用世界模型Genie 3。
可生成动态世界，每秒24帧，720p分辨率，保持几分钟一致性。
允许实时交互，提升一致性和真实感。
核心能力包括模拟物理特性、自然世界、动画和小说建模，探索不同地域与历史场景。

Grok

xAI宣布向全球所有用户免费开放Grok 4。
免费用户每天可完成少量查询，超过限制需订阅。
提供「自动」和「专家」两种运作模式。
推出时机正值OpenAI发布GPT-5并全面开放使用。

Qwen

阿里巴巴发布Qwen-Image，在复杂文本渲染和高保真图像编辑上取得突破。
核心亮点：顶级文本渲染能力（尤其中文），高一致性图像编辑。
全面的SOTA性能，开源模型。
模型架构包括条件编码器、图像分词器和多模态扩散变换器（MMDiT），总参数量270亿。

行业评论第一上海研究部 research@firstshanghai.com.hk 2025年8月11日星期一李京霖 852-25321957 Jinglin.li@firstshanghai.com.hk 李倩 852-25321539 Chuck.li@firstshanghai.com.hk 陈晓霞 852-25321956 xx.chen@firstshanghai.com.hk 行业TMT 【行业评论】 AI大模型周报 Llama：Meta的TBD实验室牵头开发新版Llama模型 8月8日，据华尔街日报，MetaPlatforms公司一个名为TBD实验室正在牵头开发最新版本的大语言模型Llama。上周，负责监督Meta超级智能实验室的首席人工智能官亚历山大·王在给员工的一份备忘录中写道，TBD实验室将与Meta的其他人工智能团队合作开展各种项目，包括即将发布的模型、模型推理能力的扩展和人工智能代理的开发。新的Llama项目由JackRae领导，他是从谷歌聘请到TBD实验室的。该项目模型还没有正式名称，但在内部被一些人称为Llama4.5和Llama4。 ChatGPT：OpenAI推出GPT5 8月7日，OpenAI发布了其最新人工智能模型GPT-5。该公司将向所有人提供GPT-5，包括免费用户，如果免费用户达到使用上限，他们可以使用GPT-5mini。OpenAI 的Plus用户有更高的使用量，Pro用户可以无限制地访问GPT-5，ChatGPTEdu和 ChatGPT企业用户将在8月6日大约一周后获得GPT-5的访问权限。模型提供 400,000tokens(输入)，128,000tokens(输出)的上下文窗口；测试集表现优异（HLE:30.7、GPQA:88.4、AIME25:100、LiveCodeBench:86.6(mini)）。OpenAI表示，该模型在写作、编程和医疗保健等领域表现突出。编程方面，可用AI根据自然语言提示生成功能代码，从而加快开发速度。在创意写作方面，GPT-5能够处理结构复杂的写作任务。健康咨询方面，GPT-5能更积极地标记潜在健康问题，帮助用户解析医疗结果。 Claude：Anthropic发布ClaudeOpus4.1 8月5日，Anthropic发布了ClaudeOpus4.1，对ClaudeOpus4在智能体任务、现实世界编码及推理能力上的升级。该版本现已向Claude付费用户、ClaudeCode用户开放，同时在其API、亚马逊Bedrock以及谷歌云VertexAI平台上线，定价与Opus4保持一致。据反馈，ClaudeOpus4.1在多数能力上较Opus4均有提升，其中多文件代码重构方面的性能提升尤为显著。该版本能精准定位大型代码库中的具体问题并修正，不会进行不必要的调整或引入漏洞。 Gemini：DeepMind推出世界模型Genie3 8月4日，谷歌DeepMind宣布推出第三代通用世界模型Genie3，给出文本提示，Genie3可以生成动态世界，每秒24帧，并以720p的分辨率保持几分钟的一致性。与前代模型（如Genie1/2）和视频生成模型（如Veo2，Veo3对直觉物理学的深刻理解）相比，Genie3是第一个允许实时交互的世界模型，同时与Genie2相比，其一致性和真实感也得到了提升。核心能力：1、模拟世界的物理特性。2、模拟自然世界。3、动画和小说建模。4、探索不同地域与历史场景。5、突破实时性能的极限：在每一帧的自回归生成过程中，模型必须考虑先前生成的随时间增长的轨迹。例如，如果用户在一分钟后重新访问某个位置，则模型必须引用一分钟前的相关信息。6、长时程环境一致性。7、第一上海证券有限公司 www.mystockhk.com 可提示的世界事件。 Grok：xAI宣布向全球所有用户免费开放Grok4 8月11日，马斯克宣布Grok4现在对所有用户免费开放。免费用户每天可完成少量查询，超过限制则需要订阅。根据xAI官方介绍，有「自动」和「专家」两种运作模式，前者会根据查询复杂度智能切换运算资源，后者则全程使用Grok4进行处理。此次免费政策推出时机耐人寻味，正值竞争对手OpenAI刚发布GPT-5并全面开放给各级用户使用之际。 Qwen：阿里巴巴发布Qwen-Image 8月4日，阿里巴巴发布了Qwen-Image。Qwen-Image在复杂文本渲染和高保真图像编辑上取得了突破。核心亮点：顶级的文本渲染能力：多语种高保真度渲染，尤其在处理复杂的中文（logographiclanguages）方面，表现远超现有模型。高一致性的图像编辑：通过创新的多任务训练框架，Qwen-Image在编辑图像时，能完美保留非编辑区域的视觉细节和整体图像的语义连贯性。全面的SOTA性能：在多项公开的图像生成和编辑基准测试中，Qwen-Image都展现了业界顶尖的性能，证明了其强大的综合实力。开放生态：作为Qwen系列的一员，它是一个开源模型，为广大开发者和研究者提供了强大的工具。模型架构：三位一体的协同作战 Qwen-Image总参数量达到了惊人的270亿（7BVLM+20BMMDiT）。结构包括条件编码器负责理解用户的输入、图像分词器负责将高清图像压缩成紧凑的潜在表示，并在生成过程结束时将其解码回高清图像、多模态扩散变换器(MMDiT)负责在VAE的潜在空间中，根据Qwen2.5-VL提供的指引，从随机噪声中逐步生成目标图像。披露事项与免责声明披露事项免责声明本报告由第一上海证券有限公司(“第一上海”)编制，仅供机构投资者一般审阅。未经第一上海事先明确书面许可，就本报告之任何材料、内容或印本，不得以任何方式复制、摘录、引用、更改、转移、传输或分发给任何其他人。本报告所载的资料、工具及材料只提供给阁下作参考之用，并非作为或被视为出售或购买或认购证券或其它金融票据，或就其作出要约或要约邀请，也不构成投资建议。阁下不可依赖本报告中的任何内容作出任何投资决策。本报告及任何资料、材料及内容并未有考虑到个别的投资者的特定投资目标、财务情况、风险承受能力或任何特别需要。阁下应综合考虑到本身的投资目标、风险评估、财务及税务状况等因素，自行作出本身独立的投资决策。本报告所载资料及意见来自第一上海认为可靠的来源取得或衍生，但对于本报告所载预测、意见和预期的公平性、准确性、完整性或正确性，并不作任何明示或暗示的陈述或保证。第一上海或其各自的董事、主管人员、职员、雇员或代理均不对因使用本报告或其内容或与此相关的任何损失而承担任何责任。对于本报告所载信息的准确性、公平性、完整性或正确性，不可作出依赖。第一上海或其一家或多家关联公司可能或已经，就本报告所载信息、评论或投资策略，发布不一致或得出不同结论的其他报告或观点。信息、意见和估计均按“现况”提供，不提供任何形式的保证，并可随时更改，恕不另行通知。第一上海并不是美国一九三四年修订的证券法(「一九三四年证券法」)或其他有关的美国州政府法例下的注册经纪-交易商。此外，第一上海亦不是美国一九四零年修订的投资顾问法(下简称为「投资顾问法」，「投资顾问法」及「一九三四年证券法」一起简称为「有关法例」)或其他有关的美国州政府法例下的注册投资顾问。在没有获得有关法例特别豁免的情况下，任何由第一上海提供的经纪及投资顾问服务，包括(但不限于)在此档内陈述的内容，皆没有意图提供给美国人。此档及其复印本均不可传送或被带往美国、在美国分发或提供给美国人。在若干国家或司法管辖区，分发、发行或使用本报告可能会抵触当地法律、规定或其他注册/发牌的规例。本报告不是旨在向该等国家或司法管辖区的任何人或单位分发或由其使用。 ©2025第一上海证券有限公司版权所有。保留一切权利。第一上海证券有限公司香港中环德辅道中71号永安集团大厦19楼电话:(852)2522-2101传真:(852)2810-6789 网址：Http://www.myStockhk.com

点击免费查看完整报告

AI 大模型周报

行业评论：AI大模型周报

Llama

ChatGPT

Claude

Gemini

Grok

Qwen

你可能感兴趣

通信行业周报：国产大模型引领AI普惠浪潮，算力需求激发产业动能

通信行业周报（20240909-20240915）：硅光及CPO趋势明显，OpenAI发布全新AI大模型

全球科技行业周报：国内厂商加速大模型推进，关注AI硬件生态催化

计算机行业周报：谷歌发布全新多模态大模型Gemma 3n，阿里达摩院发布医疗AI模型DAMOGRAPE

电子行业周报：PC市场去库存已见成效，AI大模型为手机增添新动能

计算机行业周报：阿里发布AI编程大模型Qwen3-Coder，钛动科技发布全球首个营销Agent

中泰通信行业周报：英伟达财报超预期，大模型降本加速AI商业化

计算机行业周报：北美科技巨头发布财报，AI 大模型持续升级

计算机行业周报：大模型性能提升，AI算力持续高景气

传媒行业周报：腾讯发布混元大模型，30余家机构共同发起AI安全工作组