
行业研究·行业专题 计算机·人工智能 投资评级:优于大市(维持评级) 联系人:侯睿hourui3@guosen.com.cn 证券分析师:熊莉021-61761067xiongli1@guosen.com.cnS0980519030002 摘要 Ø大模型快速迭代,推动应用能力提升。近年来全球AI持续发展,大模型在知识问答、数学、编程等能力上达到新高度,多种任务上表现超过人类水平,在各领域的可用性及准确度快速提升。2025年以来,全球大模型行业正式告别了以年为单位的代际演进,转而进入了以季度甚至月度为周期的竞速时代。同时,美国顶尖公司和实验室占据模型性能高地,中美模型代差逐渐减少。 ØToken用量上涨,国内模型排名上升。OpenClaw是一款病毒式传播的个人AI助手,推动了全球AI应用热潮。在OpenClaw等智能体项目的持续拉动下,大模型token消耗迎来进一步发展,近期大模型消耗量创新高,且增长斜率陡峭,国产模型凭借自身的性价比优势,正快速抢占市场。2025年12月7日,Openrouter上调用量前十的模型均为海外模型,而到了2026年3月9日,前十的模型中不仅包括Minimax M2.5、DeepSeek V3.2、KimiK2.5等国产模型,且API调用量占比也已超50%,反应出国产模型的性能、质价比已经大幅上升,得到市场认可。 ØAI应用推动云市场增长,IDC需求扩张。中国当前国产模型海外调用量激增更多提升了对国产数据中心需求,当前国内主要互联网与云厂商在AI基础设施上的资本开支投入进度整体仍明显落后于海外。海外真实调用量正持续转化为推理算力需求和开发者生态黏性,模型商业化能力逐步被验证,有望推动国内资本开支持续提升。AI应用对计算资源的需求极高,当AI应用商业化进入高速增长阶段,云服务成为主要承载平台,带来明显的IaaS需求增加。云厂商的基础设施依赖数据中心承载算力与存储,所以云收入增长直接刺激物理资源建设。 Ø风险提示:AI应用落地不及预期、市场需求不及预期、行业竞争加剧、宏观经济波动、新技术研发不及预等。 目录 大模型快速迭代,推动应用能力提升01AI应用推动云市场增长,IDC需求扩张03Token用量上涨,国内模型排名上升02风险提示04 AI技术快速发展,推动模型能力持续提升 •近年来全球AI持续发展,大模型在知识问答、数学、编程等能力上达到新高度,多种任务上表现超过人类水平,在各领域的可用性及准确度快速提升。从模型技术来看:1)当前模型主流架构逐步转向MoE,通过将输入Token分配给不同的专家模型,让模型在处理复杂任务时展现出更强的能力,同时也能有效降低训练、推理所需的资源,DeepSeek-V3、Qwen3、Llama 4等模型均采用MoE架构取得了低成本的高性能表现;2)模型的多模态能力显著增强,通过跨模态对齐、异构数据融合等技术,模型能够处理图像、视频、音频等多种类型的数据,从而丰富了模型的应用场景,GPT-4o、Gemini 2.5 Pro等领先模型均采用多模态技术;3)模型开始采用思维链技术,将复杂问题逐步分解为多个简单步骤,并按照步骤推导最终答案,通过分步推理的方法,模型的回答不仅更加精确可靠,其思考过程也变得清晰可懂。2024年9月,OpenAI发布o1模型,首次将思维链技术运用在底层模型当中,大幅提高了模型在测试中的表现,后续DeepSeek-R1等模型均采用思维链技术,全球模型进入推理时代。除上述方面外,模型量化、超长上下文窗口、多种RAG变体、偏好微调等技术的发展亦共同推动了模型可用性的进步,为AI在垂直领域的应用奠定了基础。 资料来源:Yaoting Wang等-《Multimodal Chain-of-Thought Reasoning: AComprehensive Survey》-arXiv-2025年-P8,国信证券经济研究所整理 模型加速迭代,测评成绩跃升 •模型迭代速率加快、规模与能力不断提升。2025年以来,全球大模型行业正式告别了以年为单位的代际演进,转而进入了以季度甚至月度为周期的竞速时代。头部厂商的模型更新频率已从2024年的四个月以上大幅压缩至三个月内,以Anthropic为例,2024年3月公司推出了Claude3系列,随后推出Claude3.5系列,并分别于6月和10月推出Sonnet和Haiku系列,共同构成了对Claude3家族的重大升级。2025年,Anthropic于2月推出Claude3.7 Sonnet,三个月后的5月又推出Claude 4,8月公司就推出Opus4.1,更新速度相较于2024年快了进50%,从季度更新向月度更新演进。 •国内方面,Deepseek、字节跳动、阿里巴巴、智谱、Minimax等头部厂商也并未放缓其模型迭代的速度。以Deepseek为例,继2024年底发布V3及2025年1月推出R1模型后DeepSeek便迅速于3月和5月推出了V3-0324与R1-0528等增强版本,并穿插发布了DeepSeek Prover-V1(4月)以强化逻辑证明能力。进入下半年,其技术飞轮进一步加速:8月推出DeepSeek V3.1,9月发布3.2-Exp实验版,10月与11月分别补齐了DeepSeek OCR与DeepSeekMath V2等关键模态拼图,最终在12月正式落地DeepSeek V3.2,模型能力不断提升,版本迭代加速。 资料来源:Artificial Analysis,国信证券经济研究所整理 资料来源:Artificial Analysis,国信证券经济研究所整理 中美模型差距缩小,国产大模型崛起 •美国顶尖公司和实验室占据模型性能高地,中美模型代差逐渐减少。自2022年ChatGPT发布以来,中美前沿模型之间的性能差距虽然一直存在,但目前已缩窄至历史最小水平。据斯坦福大学数据,2023年美国模型在性能上显著超越中国模型,在LMSYS聊天机器人竞技场中,2024年1月表现最好的美国模型比最佳的中国模型高出9.26%。到了2025年2月,差距缩小到仅1.70%。根据Artificial Analysis数据,当前中国领先AI实验室与美国领导者的性能差距已从ChatGPT发布后的超过一年,缩小到不到三个月。 •中国在开源AI模型方面已领先全球,测评表现逼近全球顶尖模型。Artificial Analysis纳入了GDPval-AA(综合推理)、𝐀²-BenchTelecom(工具调用)、Terminal-Bench Hard(终端操作)、Humanity's Last Exam(深度推理)等10项评估标准,中国模型在全球模型排行中表现优异,GLM-5成为开源SOTA模型,整体表现仅次于GPT-5.2、Claude Sonnet 4.6等世界顶尖模型。 资料来源:Artificial Analysis,国信证券经济研究所整理 资料来源:Artificial Analysis,国信证券经济研究所整理 多模态大模型更新汇总:Sora 2 •2025年9月30日,OpenAI发布最新的旗舰视频与音频生成模型Sora 2。最初的Sora模型在2024年2月推出,在许多方面堪称视频领域的GPT-1时刻。从那时起,Sora团队便专注于训练具有更先进世界模拟能力的模型。OpenAI认为Sora 2发布直接跨越到了视频领域的GPT-3.5时刻,可以做到此前视频生成模型极其困难、甚至不可能做到的事情:如奥运体操动作、在桨板上做后空翻并准确模拟浮力与刚性的动力学效果等,该模型在可控性方面也实现了巨大飞跃,能够遵循跨越多个镜头的复杂指令,同时准确保持世界状态的延续性,在现实风格、电影风格以及动漫风格的视频生成上都表现出色。 •Sora 2能够创造复杂的背景声效、语音和音效,并具备高度的真实感。用户可以将现实世界的元素直接注入到Sora 2中,例如通过观察OpenAI团队成员的视频,模型就能将其插入到任意Sora生成的环境中,并且准确还原外貌和声音。这一能力具有高度的通用性,适用于任何人类、动物或物体,这验证了在视频数据上继续扩展神经网络规模以更接近模拟现实的路径。同时,OpenAI正式发布一款新的社交iOS应用,由Sora 2驱动,用户可以创作、混合彼此的生成内容,在可定制的Sora动态中发现新视频,并通过cameo(客串)功能把自己或朋友带进作品里。用户只需在应用中完成一次性的视频和音频录制,用于验证身份并捕捉形象,就能直接把自己放入任意Sora场景中。 资料来源:公司官网,国信证券经济研究所整理 资料来源:公司官网,国信证券经济研究所整理 多模态大模型更新汇总:Seedance 2 •2026年2月7日,字节跳动AI视频生成模型Seedance2.0开启灰度测试,该模型支持文本、图片、视频、音频素材输入,可以完成自分镜和自运镜,镜头移动后人物特征能够保持一致。其所生成的视频支持平滑延长与衔接,可按用户提示生成连续镜头。Seedance2.0的编辑能力同步增强,支持对已有视频进行角色更替、删减、增加。相较于其他视频生成模型,Seedance2.0主要具有以下优势: •1)之前的AI视频生成主要依赖提示词,用户给一段指令,AI随机生成视频片段。Seedance2.0正在把这种随机性,变成可控的工业流程。Seedance2.0支持全方位多模态参考系统,用户可以同时给它最多9张图片、3段视频和3段音频,总共12个参考文件。这些参考可以用来指定动作、特效、运镜风格、人物外貌、场景氛围甚至声音效果。用户不再需要用大量文字去描述复杂的镜头,AI直接能理解视觉语言,从文字描述到视觉复刻进化; •2)Seedance2.0在生成视频的同时可以生成匹配的音效和配乐,并且支持口型同步和情绪匹配。以前拍一段带对白的戏,后期配音和口型对齐需要很多时间。现在Seedance2.0一次成型,产生生产力的质变; •3)可以在多个镜头之间维持角色和场景的一致性。这意味着用户可以让它生成包含多个镜头切换的完整叙事片段,角色不会在镜头之间无法维持统一。 •总结,Seedance2.0可以给用户提供已经接近导演级的控制精度,降低了专业表达的门槛,让更多人有工具可以将想法可视化。 资料来源:公司官网,国信证券经济研究所整理 基础大模型更新汇总:Gemini 3 •2025年11月19日,谷歌正式发布Gemini 3,目前全球最强大的多模态理解模型,也是目前最强的智能体(agentic)与“vibe coding”(创造性、沉浸式交互)模型,能够带来更丰富的可视化、更深度的互动体验,并基于最先进的推理能力构建。上下文窗口增加到100万tokens,能够以高度可靠的方式,在科学、数学等大量复杂主题上出色地解决复杂问题。 •Gemini 3以的1501 Elo得分位居LMArena排行榜首位;在Humanity’s Last Exam上取得了博士水平的推理表现(在不使用任何工具的前提下得分37.5%),在GPQA Diamond上的得分则达到91.9%。在数学方面,它也为前沿模型树立了新标杆,在MathArena Apex上取得了23.4%的最新最优成绩。不仅在文本上表现突出,Gemini 3 Pro还以81%的MMMU-Pro成绩和87.6%的Video-MMMU成绩重新定义了多模态推理。同时,它在SimpleQA Verified上取得了72.1%的业界领先成绩,显示出在事实准确性方面的巨大进步。Gemini 3的Deep Think模式进一步突破智能的边界,Deep Think的表现超过了已经非常强大的Gemini 3 Pro:在Humanity’s Last Exam上取得41.0%(不使用工具)的成绩,在GPQA Diamond上达到93.8%。它还在ARC-AGI-2上取得45.1%(使用代码执行,ARC Prize Verified)。 资料来源:公司官网,国信证券经济研究所整