您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能行业专题(14):大模型发展趋势复盘与展望 - 发现报告

人工智能行业专题(14):大模型发展趋势复盘与展望

文化传媒2026-01-05张伦可、张昊晨国信证券匡***
人工智能行业专题(14):大模型发展趋势复盘与展望

行业研究·行业专题 互联网·互联网Ⅱ 投资评级:优于大市(维持) 证券分析师:张伦可证券分析师:张昊晨0755-81982651zhanglunke@guosen.com.cnzhanghaochen1@guosen.com.cnS0980521120004S0980525010001 核心观点 •复盘美股科技巨头过去三年股价走势,AI叙事不断递进。23年OpenAI领先全球开启AI加速度,微软受益于OpenAI独家合作,估值抬升明显。24年市场低估模型进步空间,叙事转向推理侧,认为应用公司最优,Meta坐拥社交垄断生态(潜在Agent入口)和广告场景,股价为除英伟达以外PE唯一抬升的巨头。(24年2月,英伟达业绩会估计数据中心收入约40%来自推理。)同年云厂商由于大幅增加资本开支但供给受限,云收入传导有延迟,三大CSP估值略有所回落。25年模型差距与OpenAI明显收敛,谷歌后来居上,生态优势为市场追逐。26年我们认为Scaling Law将持续,模型厂商打开差异化应用市场,模型推理侧需求或进入放量拐点。模型和算力或为最优投资方向。 •25年四家巨头Capex同比增长50%以上,26年我们测算Capex将持续实现30%以上增速。25年北美四家巨头Capex持续上修,从年初3200-3300亿美元上修至年末接近4000亿美元,各家全年Capex投入均处于50%以上同比增长。巨额Capex投入数据中心建设,或面临电力瓶颈。24年北美数据中心容量约25GW,据Grid Strategies估计,至29年的五年时间将新增80GW需求,而考虑到煤电退役、配套变压器建设周期长等原因,电力缺口预计将成为主要矛盾。因此巨头在建设数据中心过程中,算力能耗比或成为关键考量因素。 •模型架构继续演化,Scaling law延续,多模态+长文本为Agent爆发提供基础。23年迎来Scaling law红利期,24年多模态、推理模型涌现,25年算法工程与Scaling Law并进。长期来看,实现AGI仍然需要模型架构突破和Scaling做到极限。展望26年:1)架构方面,下一代模型架构目前需要解决两大核心痛点:①训练阶段Transformer的计算量和内存消耗瓶颈日益凸显;②推理时模型的记忆能力有限,且模型参数无法跟随记忆变化。海外目前已经有谷歌的Titans架构、以及Mamba架构,国内则更多从成本效率优化角度出发,包括Qwen3-Next、DeepSeek V3.2都取得了明显提升。2)Scaling方面,预计26年Scaling law仍将延续,包括从预训练到后训练以及推理场景,而强化学习则将成为未来的重点突破方向;3)多模态、长文本能力更加成熟,这为Agent的涌现提供技术基础。目前中美模型差距在3-6个月,算力和算法是追赶的关键。 •通用大模型能力暂未分胜负,厂商商业化路径有差异。1)OpenAI:尽管短期模型能力被反超,但下一代模型表现仍然值得期待,C端8亿用户是其核心壁垒,公司明年也将发力企业业务;2)Gemini:当前成为大模型的SOTA基准,得益于对原生多模态路线的坚持以及自研芯片的生态,明年Tokens消耗有望继续大幅提升;3)Anthropic:坚持2B路线,在编2 核心观点 •程领域能力突出,依靠2B的定价优势有望取得更好利润率水平,目前公司估值已达到3500亿美元,25年初推出的AI编程产品年末ARR也已经达到10亿美元;4)Grok:信奉大力出奇迹,由于推理场景有限因此训练算力充足,结合特斯拉独特数据优势,下一代原生多模态模型值得期待。 •模型降低软件开发门槛,需求天花板打开,但玩家重新洗牌。25年tokens消耗更多用于大模型企业内部以及推荐系统的重构,但26年开始预计下游应用的需求将持续增加,AI实际上打开了软件需求的天花板,据IDC数据,预计2029年全球SaaS市场将达到近1万亿美元规模(对比25年5800亿美元有明显增长),但我们认为其中玩家将重新洗牌。拥有数据壁垒,主要在垂类细分场景中布局,软件定义工作流程较复杂,或对准确度要求极高的行业,被大模型替代的风险较小,比如医疗、能源、会计、安全等领域。同时我们观察到大模型厂商已经开始通过与B端软件服务商合作开发更多行业需求,或与传统SaaS厂商产生直面竞争。 •26年推理侧需求有望爆发,一级市场方面,编程场景、Agent爆发为主要应用方向。从用户量和创业公司的收入估值水平来看,当前规模增长较快的行业以AI编程、AI Agent、AI内容创作为主,聚焦生产力提升,今年以来诞生了多个爆款应用,其中AI编程软件CursorARR已达到10亿美元,AI agent Manus则在8个月时间ARR达到1亿美元,AI搜索工具Perplexity也在向Agent拓宽产品边界,其ARR也已达到2亿美元,因此明年办公场景有望迎来更多产品落地。此外,我们认为随着模型能力的成熟,明年在端侧的AI手机、AI眼镜,以及协助大模型在企业落地的分销商这些领域将看到明显的增长。 •投资建议:建议关注算力基础设施(芯片、云厂商),如阿里巴巴-W(9988.HK)、百度集团-SW(9888.HK)、英伟达(NVDA.O)、谷歌(GOOGL.O);以及大模型厂商,如阿里巴巴-W(9988.HK)、谷歌(GOOGL.O)、腾讯(700.HK)等。 •风险提示:宏观经济波动,下游需求不及预期,核心技术水平升级不及预期的风险,AI平权竞争加剧影响云业务利润率风险。 目录 美股科技巨头股价和资本开支复盘展望01 模型架构继续演化,Scaling law延续,多模态+长文本更成熟02 模型厂发展路线分化,格局动态演进03 推理需求有望爆发,看好编程、Agent等应用04 美股科技巨头走势复盘:过去三年AI领涨叙事不断演绎 •23年:OpenAI领先全球开启AI加速度,微软受益于OpenAI独家合作,估值抬升明显。全年五家巨头股价在22年大幅回撤后,均出现明显利润修复。 •24年:市场低估模型进步空间,叙事转向推理侧,认为应用公司最优,Meta坐拥社交垄断生态(潜在Agent入口)和广告场景,股价为除英伟达以外PE唯一抬升的巨头。(24年2月,英伟达业绩会估计数据中心收入约40%来自推理。)同年云厂商由于大幅增加资本开支但供给受限,云收入传导有延迟,三大CSP估值略有所回落。 •25年:模型差距与OpenAI明显收敛,谷歌后来居上,生态优势为市场追逐。上半年云厂商供给逐步释放,收入端呈现加速,AI需求景气度持续。下半年巨头逐步上修全年和26年Capex预期,市场开始担忧AI投资ROI,以及模型能力提升潜力,Scaling Law是否见顶。除谷歌外,巨头估值均出现回落。 •26年预测:Scaling Law持续,模型厂商打开差异化应用市场,模型推理侧需求或进入放量拐点。模型和算力或为最优投资方向。 资料来源:Wind、国信证券经济研究所整理 美股科技巨头走势复盘——英伟达 •英伟达在23-25年的上涨过程中经历了几轮震荡和调整,主因皆为估值达到高位后,市场对竞争、需求确定性、排产节奏等边际变化因素更加敏感,但随后英伟达均通过强劲的业绩表现回应了质疑。1)23年5月-12月:经历Q1大幅上涨后,市场普遍质疑①估值过高,②美国限制出口风险,③其他公司的竞争;2)24年中至25年4月持续震荡,一方面业绩继续强劲,北美CSP持续上修资本开支,另一方面B系列发货推迟、竞争问题(TPU等)、以及DeepseekR1出现后带来对算力需求的质疑都造成公司股价的波动。 美股科技巨头走势复盘:25年AI叙事变化,拥抱最确定的方向 •北美AI叙事的变化:拥抱最确定的方向。年初市场陷入Scaling law放缓的论调,Deepseek发布后质疑CAPEX强度,因此英伟达领跌,选择最先AI落地广告兑现的Meta。Q2各公司持续上修资本开支,继续坚定“大力出奇迹”,结合英伟达业绩兑现,市场重新拥抱算力。Q3开始伴随谷歌反垄断压制解除,同时Gemini模型领先,用户持续增长,结合对OpenAI海量算力订单的质疑,市场对谷歌达成共识。全年来看,Meta由于在模型训练投入收效甚微,亚马逊由于在资本开支、自研芯片、模型的落后,二者成为表现最差的两家公司。 资本开支回顾与展望:逐季度上修,26年预计仍将增长30%以上 •25年北美科技公司资本开支持续上修,年初3200-3300亿美元增长至年末的接近4000亿美元,各家全年Capex投入均处于50%以上同比增长。微软:约1160亿美元(同比+54%);亚马逊:1250亿美元(同比+61%);谷歌:910-930亿美元(同比+73%-77%);Meta:700-720亿美元(同比+78%-84%)。预计26年仍将实现30%以上增长。 资料来源:公司财报、彭博、国信证券经济研究所整理 资料来源:Gemini、国信证券经济研究所整理 资本开支展望:电力成为制约CAPEX增长的核心因素 •随着资本开支的持续增加,北美数据中心的用电需求急剧增加,26年预计CAPEX增长的限制因素将从缺芯更多转向缺电,微软CEO曾表示微软手里囤积着成堆的英伟达AI芯片,却因为缺电、缺空间,只能让这些昂贵的GPU在仓库里“吃灰”。据FERC(美国联邦能源管理委员会)预测,24年美国夏季用电负载峰值为929GW,预计到2029年5年时间将累计新增120GW。而据Grid Strategies估计,120GW的增量中大约80GW来自数据中心。 •电力供给无法与需求增量匹配带来用电缺口:1)为了实现环保目标,北美有大量煤电厂需要退役;2)数据中心配套的变压器、输电线等设施的建设周期长达5-8年;3)电力需求要求冗余,这进一步推高了对电网的供给量要求。 •面对电力缺口,目前各公司通过:1)与能源公司紧密绑定,例如谷歌收购Intersect Power,亚马逊收购了Talen Energy位于Susquehanna核电站旁的数据中心园区。绑定之后通过“计量表后”(behind-the-meter)供电方式——直接将电力接入数据中心,绕过公共电网,以弥补供能缺口;2)像海外寻找电力支撑,例如欧洲、亚太等电力资源相对丰富的区域;3)采用租赁电力资源充足的数据中心。 资料来源:Grid Strategies、国信证券经济研究所整理 资料来源:Grid Strategies、国信证券经济研究所整理 目录 美股科技巨头股价和资本开支复盘展望01模型架构继续演化,Scaling law延续,多模态+长文本更成熟02模型厂发展路线分化,格局动态演进03推理需求有望爆发,看好编程、Agent等应用04 模型发展趋势:23年从“技术奇点”向“产业爆发” •Scaling law红利期,OpenAI领先优势明显。23年各模型厂商的模型版本快速迭代,基本在半年时间就能完成一个大版本的升级,主要是由于预训练阶段的scaling law尚未触及数据瓶颈,通过扩展参数能够实现模型性能的快速提升,具备先发优势的OpenAI在23年通过GPT-4确立了模型在逻辑推理、复杂指令遵循上的SOTA基准。 •模型仍以文本为主导,多模态雏形出现。OpenAI作为技术的领导者推出了视觉理解模型GPT-4V,以及基于扩散模型的视频模型DALLE·3,嵌入ChatGPT产品,增加其图像、视频能力,谷歌的原生多模态模型Gemini也在23年末正式推出。 •基于Transformer架构的大语言模型应用场景以Chatbot为主。受限于推理能力和上下文长度,在编程等场景中仅具备本科学生级别基本代码能力,可处理中等难度问题,但仍然主要依赖网页端一问一答、手动改代码。 资料来源:artificial analysis、国信证券经济研究所整理 模型发展趋势:23年从“技术奇点”向“产业爆发” •模型参数和训练数据量持续增长。根据DeepMind团队22年提出的Chinchilla Scali