您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国证国际]:大模型下半年看点及投资机会 - 发现报告

大模型下半年看点及投资机会

2025-07-04 王婷 国证国际 娱乐而已
报告封面

目录2025/7/4➢最近2个月大模型重大更新加速•海外大模型API调用量快速增长•中美大模型差异•大模型的token处理量•模型价格➢海外公司布局分析•谷歌、OpenAI、Meta等➢国内大模型技术及运用层面•基础模型•模型运用➢投资机会 投资概览➢大模型技术/产品迭代周期缩短,需求加速增长。•5-6月,海外大模型迭代迅速且密度高,模型能力提升明显、同时成本下降。谷歌、OpenAI、Anthropic的模型表现优异。国内大模型DeepSeek领先。•海外大模型API调用量增长,行业推理需求增加明显,是AI投资叙事的强劲支撑。•中美差异:技术迭代时差、产品运用、2B/2C生态。➢美股:•Alphabet(GOOGL.US):Gemini 2.5系列模型能力优异,Agent工具落地,兼具大模型技术领先+智能体产品落地。•Meta(META.US):我们认为,Meta在AI周期中的核心优势在于社交场景、C端产品布局深厚,AI在社交生态的运用契合产品创新、用户体验优化、粘性提升,从而带动商业化的正向循环。➢港股:•阿里巴巴(BABA.US/9988.HK):AI带动云收入加速增长仍是阿里的核心叙事,2026财年云智能收入增速有望提升至20%+。考虑大模型能力、云计算产品市场份额,我们认为阿里在AI浪潮中的站位仍保持竞争优势。若国内B端大模型需求爆发,阿里仍是直接受益方。•快手(1024.HK):当前视频生成技术仍在快速迭代中,我们认为未来竞争不仅取决于技术能力,在产品端、用户端有know-how的公司将在商业化中具备优势。可灵AI技术迭代、商业化提速是快手股价短期的核心催化剂,同时AI对视频生态的广告效率提升是中长线增长逻辑。 请参阅本报告尾部免责声明 3 最近2个月大模型重大更新加速➢5-6月,大模型更新迭代快,数量多,谷歌、OpenAI、Anthropic的模型表现优异。重点产品包括:•2025/4/14-4/16,OpenAI先后发布GPT-4.1、o3、o4-mini,多模态深度思考能力提升;•2025/5/6,谷歌推出Gemini 2.5 Pro Preview 0506,AI编程能力对齐Anthropic Claude。5月20日,发布Gemini 2.5 Flash版本;•2025/5/23,Anthropic发布新一代Claude Sonnet 4和Opus 4,编码及推理能力优异;•2025/5/28,DeepSeek R1版本更新,综合性能大幅提升;•2025/6/5,谷歌发布Gemini 2.5 Pro Preview 0605,引入“思维预算”(thinking budgets),平衡成本与响应延迟;•2025/6/10,OpenAI发布o3-pro,超越Gemini 2.5 Pro、Claude 4 Opus等,目前模型能力领先。大模型的Intelligence Index对比(包含7项基准测试,分数越高模型综合性能越好)资料来源:Artificial Analysis(注:Index评分包含7个维度,即MMLU-Pro, GPQA Diamond, Humanity's Last Exam,LiveCodeBench,SciCode, AIME, MATH-500) 4 中美大模型相差多少?资料来源:Artificial Analysis(注:Index评分包含7个维度,即MMLU-Pro, GPQA Diamond, Humanity's Last Exam,LiveCodeBench,SciCode, AIME, MATH-500)中美大模型的Intelligence Index对比(包含7项基准测试,分数越高模型综合性能越好) 中美大模型相差多少?资料来源:Artificial Analysis,国证国际(灰色为美国大模型,红色为中国大模型)01020304050Qwen3 8B (Reasoning)Gemini 2.0 Flash Thinking exp. (Jan '25)DeepSeek R1 0528 Qwen3 8BDeepSeek R1 Distill Qwen 32BGemini 2.5 FlashDeepSeek V3 0324 (Mar '25)Claude 4 SonnetGPT-4.5 (Preview)GPT-4.1 miniGPT-4.1o1-miniGemini 2.5 Flash-Lite (Reasoning)Magistral Smallo1-proGrok 3 Reasoning BetaMagistral MediumQwen3 14B (Reasoning)Qwen3 30B A3B (Reasoning)Claude 3.7 Sonnet ThinkingQwQ-32BClaude 4 OpusQwen3 32B (Reasoning)Gemini 2.5 Flash (April '25) (Reasoning)DeepSeek R1 (Jan '25)o1-previewMiniMax M1 40kLlama Nemotron Ultra ReasoningClaude 4 Sonnet ThinkingQwen3 235B (Reasoning)o1MiniMax M1 80ko3-miniClaude 4 Opus ThinkingGemini 2.5 Flash (Reasoning)o3-mini (high)Grok 3 mini Reasoning (high)DeepSeek R1 0528 (May '25)Gemini 2.5 Pro (May' 25)Gemini 2.5 Pro (Mar '25)Gemini 2.5 Proo3o4-mini (high)o3-pro 6➢美国高性能大模型密度更高。最近2个月海外多个公司的模型密集迭代。中国大模型最近重要更新为DeepSeek(2025/5/28)、Minimax。➢开源vs.闭源:中国领先模型均坚定走开源路线,在开源模型中,技术水平优于海外。 模型价格对比:开源模型价格优势明显请参阅本报告尾部免责声明资料来源:Artificail Analysis,国证国际(截至2025年6月30日)6060301515151010884.44.4 4.4 4.41.51.60.60.47575752424151515151515154.0GPT-4o1o1-previewGPT-4 TurboGPT-4o (March 2025)GPT-4o (May '24)GPT-4o (ChatGPT)GPT-4o (Nov '24)GPT-4o (Aug '24)o3GPT-4.1o4-mini (high)o3-mini (high)o3-minio1-miniGPT-3.5 TurboGPT-4.1 miniGPT-4o miniGPT-4.1 nanoClaude 4 Opus ThinkingClaude 4 OpusClaude 3 OpusClaude 2.1Claude 2.0Claude 4 Sonnet ThinkingClaude 3.7 Sonnet ThinkingClaude 4 SonnetClaude 3.7 SonnetClaude 3.5 Sonnet (Oct)Claude 3.5 Sonnet (June)Claude 3 SonnetClaude 3.5 HaikuOpenAIAnthropic百万token输出价格(美元)0.90.80.80.70.60.50.30.10.10.10.14.02.21.11.10.80.30.30.30.30.30.20.10.08.48.46.44.22.82.8Llama 3.1 405BLlama 4 MaverickLlama 3 70BLlama 3.1 70BLlama 3.3 70BLlama 3.2 90B (Vision)Llama 4 ScoutLlama 2 Chat 7BLlama 3.2 11B (Vision)Llama 3.1 8BLlama 3 8BLlama 3.2 1BDeepSeek R1 (Jan '25)DeepSeek R1 0528 (May'25)DeepSeek V3 0324 (Mar'25)DeepSeek V3 (Dec '24)DeepSeek R1 Distill Llama70BDeepSeek R1 Distill Qwen32BDeepSeek-V2.5 (Dec '24)DeepSeek-V2.5DeepSeek-Coder-V2DeepSeek-V2DeepSeek R1 Distill Qwen14BDeepSeek R1 0528 Qwen38BDeepSeek R1 Distill Llama8BQwen3 235B (Reasoning)Qwen3 32B (Reasoning)Qwen2.5 MaxQwen3 14B (Reasoning)Qwen3 235BMetaDeepSeek百万token输出价格(美元) 海外大模型API调用量快速增长请参阅本报告尾部免责声明大模型API调用量(周度数据):2月至今维持较高速增长资料来源:Open Router,国证国际资料来源:Open Router,国证国际1,1301,010661559516471458334291257216Gemini 2.0FlashClaudeSonnet 4Gemini 2.5FlashPreview 05-20GPT-4o-miniDeepSeekV3 0324(free)Claude 3.7SonnetDeepSeekV3 0324Gemini 2.5Pro Preview05-06Gemini 2.0Flash LiteGemini 2.5FlashPreview 04-17DeepSeek:R1 0528(free)2025年6月API调用量(十亿)大模型API调用量对比(2025年6月)-5001,0001,5002,0002,5002024/7/12024/7/222024/8/122024/9/22024/9/232024/10/142024/11/42024/11/252024/12/162025/1/62025/1/272025/2/172025/3/102025/3/312025/4/212025/5/12大模型API每周调用量合计(十亿) 8➢今年2月以来,海外大模型API调用量增长迅速。据Open Router数据,周度数据看,6月底大模型API周度调用量超2万亿。➢谷歌、Anthropic模型调用量领先。6月调用量看,Gemini 2.0 Flash模型调用量为1.13万亿,Claude Sonnet 4调用量为1.0万亿。➢API调用量快速增长反映下游场景需求的增长,是AI投资叙事的强劲支撑。 大模型的token处理量,谷歌领先请参阅本报告尾部免责声明➢据Open Router数据,5-6月,大模型token处理量呈加速增长趋势,其中谷歌的token日处理量领先,6月底达1,600亿/日水平,维持领先水平,反映生态内AI需求强劲。➢DeepSeek是国内日token处理量最高模型,6月底接近600亿,约为谷歌的35-40%。资料来源:Open Router,国证国际每日Token处理量对比:谷歌领先020406080100120140160180GoogleOpenAIAnthropic(十亿) 9DeepSeekMeta Alphabet:全面进入Gemini 2.5时代请参阅本报告尾部免责声明➢全面进入Gemini 2.5时代,AI Agent工具落地。谷歌在2025年的Google I/O开发者大会,发布大模型重磅更新及多个产品,Agent产品逐步落地,包含视频生成、搜索、编程、个性化助手等多