您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:计算机行业2025年1月投资策略:国产deepseek+豆包发力,海内外大模型刺激推理算力 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业2025年1月投资策略:国产deepseek+豆包发力,海内外大模型刺激推理算力

信息技术2025-01-27熊莉、库宏垚、艾宪国信证券A***
AI智能总结
查看更多
计算机行业2025年1月投资策略:国产deepseek+豆包发力,海内外大模型刺激推理算力

海外资本支出呈现持续上扬的态势,而国内资本支出近期承压。全球云计算厂商资本开支进入新一轮增长浪潮,AI基础设施成为核心驱动力。国外厂商中,微软24Q3资本开支同比增78.6%,主要投向AI和云服务;谷歌维持高位,聚焦服务器和数据中心;亚马逊连续五季环比增长,全年预计750亿美元。国内厂商中,阿里巴巴24Q3同比增239.63%,加码AI基础设施;腾讯同比增113.54%,布局GPU、CPU服务器及数据中心;百度虽承压,预计24年底或25年初迎来回升,重点投入AI模型和智能云服务。 全球服务器出货同比回升,B+C端应用逐步落地,思维链等新技术拉动推理算力需求增长。C端应用如ChatGPT访问量持续增长,国内多款AI产品MAU快速上升;B端AI赋能商业增长显著,AppLovin、Palantir等公司业绩大幅提升。AI推理侧需求因思维链(CoT)技术及模型参数量增加快速增长。 CoT对千亿参数模型显著提升推理能力,同时推理次数和算力需求快速增加。 中国AI芯片市场规模23年达1038.8亿元,预计25年增长至1780亿元,推理算力占比24年有望升至67.7%。国内外厂商如博通、Marvell、寒武纪等积极布局AI推理硬件,助推算力发展。 国产科技巨头在AI大模型与算力领域持续突破。字节跳动发布豆包Pro对标GPT-4o,API调用量大增,多场景渗透;召开冬季FORCE原动力大会,推出数据飞轮2.0,强化全模态数据管理;正式推出情感大模型,在豆包APP全量开放。小米升级MiLM2模型,参数灵活扩展,端云结合适配多场景;加速GPU集群建设提升算力。阿里倚天710芯片大规模落地,阿里云为双11提供百万核级算力。腾讯升级星脉网络2.0,优化网络协议与通信库,提升大模型训练效率。 多层面技术提升训练效率,测试性能领跑开源模型。2024年12月26日,DeepSeek上线并开源DeepSeek-V3模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2架构,引入新技术,如无辅助损失负载均衡策略、MTP提升数据利用率。训练层通过DualPipe算法和FP8混合精度训练实现成本控制与效率提升。推理层先推出R1-Lite模型,后将R1推理能力迁移至V3提升其性能,推理算力包含GB300、博通、marvell等各类asic芯片。2025年1月发布的DeepSeek-R1模型在多测试中超越OpenAI的o1,在数学、编程及多种测试中表现出色。 风险提示:大模型研发进展不及预期、云厂商资本开支投入不及预期、国产算力迭代及供应不及预期。 需求侧:海外资本支出呈现持续上扬的态势,而国内资本支出近期承压 美国对华芯片管制措施的持续加码,严重限制了中国获取高端半导体芯片的途径,这激发了对国产算力需求的急剧增加。以下是近期美国对华芯片管制措施: 图1:美国近期对华芯片管制措施 复盘云计算厂商历史,全球性资本开支增长仅有两次:第一次,2010年美国制定“云优先”的发展战略,全球云计算蓬勃发展,各厂商资本开支均快速增长;第二次,23年以来,全球人工智能快速发展,云厂商大力进行AI基础设施建设,驱动新一轮资本开支上升周期。 国外云产商资本开支持续增加 微软:24年资本开支维持高同比增速。24Q3资本支出(包括融资租赁)200亿美元,同比+78.6%、环比+5.3%,其中用于购买财产、厂房和设备的现金支付为149亿美元,同比+50.7%。根据公司财报电话会议披露,资本开支总体投向AI和云,其中约一半用于长期资产,另一半用于采购服务器(包括CPU及GPU)。公司预计,随着公司扩大人工智能服务规模,资本支出将继续增加。遇进一步提升市占率。 图2:微软FY25Q1(=24Q3)资本开支200亿美金,同比+78.6%、环比+5.3% 谷歌:24年资本开支维持高位。谷歌FY24Q3资本开支为130.61亿美元,同比+62.15%、环比-0.95%,环比基本持平。资本开支主要用于服务器、网络设备的购买以及数据中心的建设,融资租赁成本在财务上不显著;同时,预计Q4资本开支将与Q3持平。 图3:谷歌FY24Q3资本开支131亿美金,同比+62.15%、环比-0.95% 亚马逊:资本开支连续五季度环比增长。24Q3资本开支达212.78亿美元,同比+88.33%、环比+29.7%,连续五个季度环比增长,大部分支出主要投资于AI服务需求,同时包括支持北美和国际业务的技术基础设施。全年资本开支预计750亿,下个季度预计231亿美金。 图4:亚马逊FY24Q3资本开支213亿美金,同比+88.33%、环比+29.7% 国内云产商资本支出复苏有望 阿里巴巴:资本开支迅速复苏。2024年Q3资本支出达到峰值174.91亿元,同比+239.63%,环比+44.63%,连续五个季度快速增长,主要投向AI基础设施,如数据中心、服务器等,以满足AI相关产品的需求。还投入电商AI算力,支持多款在研AI产品,提升用户体验和商家服务。预计未来阿里巴巴的资本支出将继续保持增长态势,主要投向AI领域,包括对AI初创公司的投资、数据中心建设以及相关服务器等基础设施的购置。 图5:阿里巴巴FY24Q3资本开支174.91亿人民币,同比+239.63%、环比+44.63% 腾讯:资本开支于2024年同比显著提升。24Q3达峰值170.94亿人民币,同比+113.54%,环比+95.83%,大部分支出主要投入AI领域,如对GPU和CPU服务器的投资增加。还用于数据中心建设,包括新建多个百万级服务器规模的数据中心,也投向与AI相关的企业,如MiniMax、智谱AI、百川智能等。预计未来腾讯资本支出仍将保持一定规模,持续投入AI领域及数据中心建设等,同时也会根据电商等业务的发展情况进行相应的资本布局。 图6:腾讯FY24Q3资本开支170.94亿人民币,同比+113.54%、环比+95.3% 百度:资本开支近期承压。资本支出于21Q4达到峰值后,于2022年同比减少,并在2023年再次回升,资本开支上行周期间隔约4-5个季度,目前资本开支仍处于低位,根据历史经验,资本开支有望在24Q4或25Q1重回上行周期。24年Q3资本支出为16.45亿人民币,主要投入人工智能领域,用于购买支持大型人工智能语言模型训练的处理器和基础设施。同时,百度也在智能云服务方面有所投入,推动该业务增长。 图7:百度FY24Q3资本开支16.45亿人民币 推理侧:全球服务器出货同比回升,B+C端应用逐步落地拉动推理算力需求增长 全球服务器分年度出货情况。出货量于2022年达峰值,并在2023年同比下降。 24Q1-Q3,服务器出货量同比再次回升,Q1-Q3全球服务器出货量达1049.83万台,同比+14.2%。 图8:全球服务器分年度出货复盘 国内服务器出货情况:与全球出货走势类似,出货量于2022年达峰值,并在23年开始下滑,24Q1-Q3服务器出货量同比回升,Q1-Q3出货达313.68万台,同比+18.83%。 图9:国内服务器分年度出货复盘 C端:AI应用数据持续增长。从全球来看,ChatGPT周度访问量持续提升,根据Similarweb数据,最近一周(11月28日-12月4日)访问量合计为8.99亿次,环比+0.5%;根据AI产品榜数据,11月ChatGPT的MAU数据为 287.25M ,环比+11.27%。从国内来看,豆包、文小言、Kimi、智谱清言等AI应用快速发展,根据AI产品榜数据,11月豆包、文小言、Kimi、智谱清言MAU分别为 59.98M 、 12.99M 、12.82M 、 6.37M ,分别环比+16.92%、3.33%、27.40%、22.18%。 图10:ChatGPT周度访问量数据持续上升 图11:11月全球TOP10AI产品有7款MAU环比增长 B端:AI赋能公司业绩增长。在广告领域,AppLovin在AppDiscovery平台使用AXON2.0 AI驱动技术拉动广告商支出增长,三季度收入同比+39%、净利润同比+300%,且四季度展望乐观;在数据分析领域,Palantir推出AIP平台,集成多款大模型,用于数据分析,拉动其商业客户收入增长,三季度收入同比+30%(其中美国商业业务同比+54%),且上调全年收入指引为28.05-28.09亿美元(前值为27.42-27.50亿美元)。Salesforce、DocuSign、Asana等公司受益于AI驱动,三季度业绩表现出色。 AI应用逐步落地,拉动推理算力需求增长。从单次推理来看,主要包括分词(Tokenize)、嵌入(Embedding)、位置编码(PositionalEncoding)、Transformer层、Softmax,推理主要计算量在Transfomer解码层,对于每个token、每个模型参数,需要进行2×1Flops=2次浮点运算,则单词推理算力消耗为模型参数量×(提问Tokens+回答Tokens)×2,随着模型参数量增长、模型向多模态发展,单次推理算力消耗持续增长。从推理次数来看,AI应用逐步落地,模型推理次数提升,拉动推理算力需求快速增长。 OpenAI发布GPT-O1,通过思维链提升模型推理能力。24年9月12日,OpenAI发布GPT-O1,同GPT-4O相比,GPT-O1在数学、代码、科学问题(PhD级别)评分显著提升。GPT-O1在回复用户问题之前会生成一条较长的内部思维链,将复杂的问题拆分为更简单的步骤,且当前方法无效时,会进一步尝试其他方式,引入思维链将显著提升模型的推理能力。 图12:GPT-O1在数学、代码、科学问题(PhD级别)评分显著高于GPT-4o 图13:GPT-O1推理占比大幅提升 思维链(CoT)拉动推理算力增长。1)思维链(CoT)需要多步推理进而大幅提升推理算力的需求,同时推理时间的增长亦是推理算力消耗增长的反映;2)根据JasonWei等人在23年发布的文章 《Chain-of-Thought Prompting Elicits ReasoninginLargeLanguageModels》,思维链仅对1000亿以上参数模型的推理有显著提升;此前,为节省推理算力消耗,大多数模型通过蒸馏等方式缩小模型参数量,而思维链反向限定模型参数量下限,进而拉动推理阶段算力需求增长。 图14:思维链多步推理提升推理阶段算力消耗 图15:思维链(CoT)在1000亿参数模型上才能带来显著提升 Cooperative Driving Automation: a Large Language ReasoninginLargeLanguageModels》-arXiv(2023)-P5,国信证 Model-DrivenDecision-MakingFramework》-arXiv(2024)-P6,券经济研究所整理国信证券经济研究所整理 中国AI芯片市场规模快速增长,推理算力占比有望提升。根据亿欧智库数据,23年中国AI芯片市场规模约1038.8亿元,预计25年增长至1780亿元,对标23-25年CAGR为30.9%,中国AI芯片市场规模快速增长。随着AI应用逐步落地以及思维链等技术的运用,推理侧算力需求有望快速提升,根据《2023-2024年中国人工智能计算力发展评估报告(IDC&浪潮)》发布数据,预计24年中国推理算力占比为67.7%,同比+26.4个pct。 图16:中国AI芯片市场规模快速增长 图17:预计24年开始推理算力占比大幅提升 博通:从客户来看,公司为谷歌、Meta等客户定制AIAsic芯片;从技术来看,公司可以提供高复杂度的定制加速卡(XPU)和Asic,主要包括:1)计算:处理单元架构(客户提供)、设计流程和性能优化(博通);2)内存:HBMPHY、集成与性能(博通);3