AI智能总结
行情回顾。本周通信行业(申万)下跌了9.64%,跑输沪深300指数涨幅(-2.22%)7.42个百分点,跑输创业板指数涨幅(-4.87%)4.77个百分点。今年以来通信行业(申万)上涨了2.78%,跑赢沪深300指数涨幅(-1.14%)3.92个百分点,跑赢创业板指数涨幅(1.34%)1.44个百分点。本周通信行业涨幅(-9.64%)在所有一级行业中排序第27,全年涨幅排序第8。截至本周末,通信行业(申万)估值PE- TTM 为33.69,同期沪深300 PE- TTM 为12.55,创业板指数PE- TTM 为33.54。本周通信板块涨幅前五分别为蜂助手(+50.13%)、恒为科技(+31.70%)、翱捷科技-U(+30.00%)、共进股份(+27.95%)、卓翼科技(+26.38%);本周通信板块跌幅前五分别为德科立(-33.91%)、博创科技(-26.27%)、太辰光(-24.91%)、瑞可达(-20.96%)、新易盛(-20.65%)。 训练及推理需求共同带动英伟达Blackwell增长,网络业务预计将在FY26Q1恢复增长。英伟达发布FY2025Q4业绩,实现收入393亿美元,同比+78%,环比+12%;实现GAAP净利润221亿美元,同比+80%,环比+14%;实现Non-GAAP净利润221亿美元,同比+72%,环比+10%。分不同业务看,数据中心为驱动增长的核心业务,最近一个季度收入占比达90%。 1)数据中心-计算:FY25Q4收入环比增长18%,同比增长2倍多。训练方面,后训练和模型定制正在推动对NVIDIA基础设施和软件的需求。推理方面,在测试时间扩展和OpenAI的o3、DeepSeek-R1和Grok 3等新推理模型的推动下,推理需求正在加速。 2)数据中心-网络:FY25Q4收入环比下降3%。英伟达正在从带有InfiniBand的小型NVLink 8过渡到带有Spectrum-X的大型NVLink 72。Spectrum-X和NVLink Switch收入增加且是新的主要增长点。预计将在FY26Q1恢复增长。 英伟达此前受限于新的机架式方案带来的工程等问题导致了整体出货节奏延迟,随着相关问题解决,Blackwell产品已恢复正常出货节奏。随着英伟达GB300等产品开始批量出货,及下一代Blackwell Ultra提上日程,有望持续带动对于1.6T及800G等高速率光模块产品的需求,重点推荐新易盛、天孚通信、中际旭创,建议关注源杰科技。 在本次开源周,DeepSeek陆续开放了五个代码库,向全世界分享了其在通用人工智能基础设施领域的最新突破。代码库涵盖大模型推理加速、通信优化、矩阵运算内核提升、并行计算效率改进、分布式文件系统五个关键领域:FlashMLA通过低秩KV压缩技术减少推理内存占用,提升长文本推理效率; DeepEP优化MoE模型通信,降低训练成本;DeepGEMM实现高性能FP8矩阵计算,推动低精度计算转型;DualPipe和EPLB分别优化流水线并行和负载均衡,缩短大模型训练时间;3FS则打破“存储墙”限制,为AI训练与推理提供高效数据支持。 本轮技术进步对推理和应用侧的推动作用都是显著的。在推理侧,它们提升了解码效率,降低了显存占用和硬件门槛,使大模型服务能处理更多并发请求,有效降低了企业的算力门槛;在训练侧,这些技术减少了训练时间和成本,提升了训练速度,让大规模模型训练更加高效。3月1日DeepSeek宣布了“One More Thing”,揭秘V3/R1推理系统,公开了大规模部署成本和收益。根据《DeepSeek-V3/R1推理系统概览》,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。我们认为五大代码库的开源为人工智能领域的进一步发展奠定了坚实基础,训练+推理侧硬件使用成本下滑下国内AI相关资本开支将有显著提振,国产算力景气度将进一步上行。建议关注国产GPU、服务器、交换机、光模块、高速铜缆等国产算力各细分产业链,重点推荐盛科通信,建议关注光迅科技、锐捷网络、华工科技、紫光股份、共进股份等。此外建议关注推理需求涌现带来的AIDC建设及规模化GPU算力及通信网络部署需求,重点推荐润泽科技,建议关注科华数据、世纪互联、光环新网。 通信行业持续跟踪公司: 运营商:重点推荐中国移动、中国电信、中国联通;光模块光器件光芯片:重点推荐天孚通信、中际旭创、新易盛,建议关注光迅科技、源杰科技;卫星通信:建议关注海格通信、震有科技;液冷:建议关注英维克、高澜股份;设备商:建议关注紫光股份、中兴通讯、锐捷网络、共进股份;IDC&AIDC:推荐润泽科技,建议关注奥飞数据、光环新网、科华数据;物联网模组:推荐广和通,建议关注威胜信息、有方科技;控制器:推荐拓邦股份、和而泰;军工通信:推荐七一二、上海瀚讯。 风险提示:AI模型进展不及预期,云厂商资本开支不及预期,国产算力发展不及预期,经济系统性风险。 一、本周行情回顾(2025/2/24-2025/3/2) (一)通信板块整体行情走势 本周通信行业(申万)下跌了9.64%,跑输沪深300指数涨幅(-2.22%)7.42个百分点,跑输创业板指数涨幅(-4.87%)4.77个百分点。今年以来通信行业(申万)上涨了2.78%,跑赢沪深300指数涨幅(-1.14%)3.92个百分点,跑赢创业板指数涨幅(1.34%)1.44个百分点。 图表1通信(申万)指数、创业板指和沪深300指数走势(以2014/12/31为基点) 本周通信行业涨幅(-9.64%)在所有一级行业中排序第27,全年涨幅排序第8。 图表2一级行业年与周涨跌幅 (二)个股表现 本周通信板块涨幅前五分别为蜂助手(+50.13%)、恒为科技(+31.70%)、翱捷科技-U(+30.00%)、共进股份(+27.95%)、卓翼科技(+26.38%); 本周通信板块跌幅前五分别为德科立(-33.91%)、博创科技(-26.27%)、太辰光(-24.91%)、瑞可达(-20.96%)、新易盛(-20.65%)。 图表3本周通信板块涨跌幅前十个股 二、训练及推理需求共同带动英伟达Blackwell增长,网络业务预计FY26Q1恢复环比增长 英伟达发布FY2025Q4业绩,实现收入393亿美元,同比+78%,环比+12%;实现GAAP净利润221亿美元,同比+80%,环比+14%;实现Non-GAAP净利润221亿美元,同比+72%,环比+10%。 图表4英伟达FY25Q4业绩 分不同业务看,数据中心为驱动增长的核心业务,最近一个季度收入占比达90%。 1)数据中心:第四季度收入达到创纪录的356亿美元,比上一季度增长16%,比一年前增长93%。FY25全年收入增长142%,达到创纪录的1,152亿美元。Blackwell实现110亿美元收入,为英伟达历史上爬坡最快的产品。 2)游戏及AIPC:第四季度游戏收入为25亿美元,比上一季度下降22%,比一年前下降11%。全年收入增长9%,达到114亿美元。 3)专业可视化:第四季度收入为5.11亿美元,比上一季度增长5%,比一年前增长10%。 全年收入增长21%,达到19亿美元。 4)汽车及机器人:第四季度汽车业务收入为5.7亿美元,比上一季度增长27%,比一年前增长103%。全年收入增长55%,达到17亿美元。 图表5英伟达不同业务收入 训练及推理需求共同带动Blackwell增长,网络业务预计将在FY26Q1恢复增长。 1)数据中心-计算:FY25Q4收入环比增长18%,同比增长2倍多。 训练:后训练和模型定制正在推动对NVIDIA基础设施和软件的需求。客户正在竞相扩展基础设施,以训练下一代尖端模型并解锁更高水平的AI功能。使用Blackwell,这些集群通常有100,000个或更多GPU,这种规模的多个基础设施已经开始发货。随着开发人员和企业利用微调强化学习和蒸馏等技术为特定领域的用例定制模型,后训练和模型定制正在推动对NVIDIA基础设施和软件的需求。后训练和模型定制的规模是巨大的,并且总共需要比预训练更多几个数量级的计算。 推理:在测试时间扩展和OpenAI的o3、DeepSeek-R1和Grok 3等新推理模型的推动下,推理需求正在加速。与一次性推理相比,长思维推理AI每个任务可能需要多100倍的计算。Blackwell的架构用于推理AI推理。与Hopper 100相比,Blackwell的token吞吐量提高了25倍,成本降低了20倍,增强了推理AI模型。许多早期的GB200部署都专门用于推理,这在新架构中尚属首次。 2)数据中心-网络:FY25Q4收入环比下降3%。预计将在FY26Q1恢复增长。 英伟达正在从带有InfiniBand的小型NVLink 8过渡到带有Spectrum-X的大型NVLink 72。Spectrum-X和NVLink Switch收入增加且是新的主要增长点。我们预计网络将在FY26Q1恢复增长。AI需要一类新的网络,NVIDIA提供用于scale-up计算的NVLink交换系统,对于scale-out,公司为HPC提供Quantum产品、为以太网环境提供Spectrum X产品。Spectrum-X增强了用于AI计算的以太网,并取得了巨大的成功。 Microsoft Azure、OCI、CoreWeave和其他公司正在使用Spectrum-X构建大型AI工厂。 第一个Stargate数据中心也将使用Spectrum-X。 英伟达此前受限于新的机架式方案带来的工程等问题导致了整体出货节奏延迟,随着相关问题解决,Blackwell产品已恢复正常出货节奏。随着英伟达GB300等产品开始批量出货,及下一代Blackwell Ultra提上日程,有望持续带动对于1.6T及800G等高速率光模块产品的需求,重点推荐新易盛、天孚通信、中际旭创,建议关注源杰科技。 三、DeepSeek开源周落幕,成本利润率可达545% 在本次开源周,DeepSeek陆续开放了五个代码库,向全世界分享了其在通用人工智能基础设施领域的最新突破。代码库涵盖大模型推理加速、通信优化、矩阵运算内核提升、并行计算效率改进、分布式文件系统五个关键领域:FlashMLA通过低秩KV压缩技术减少推理内存占用,提升长文本推理效率;DeepEP优化MoE模型通信,降低训练成本; DeepGEMM实现高性能FP8矩阵计算,推动低精度计算转型;DualPipe和EPLB分别优化流水线并行和负载均衡,缩短大模型训练时间;3FS则打破“存储墙”限制,为AI训练与推理提供高效数据支持。 本轮技术进步对推理和应用侧的推动作用都是显著的。在推理侧,它们提升了解码效率,降低了显存占用和硬件门槛,使大模型服务能处理更多并发请求,有效降低了企业的算力门槛;在训练侧,这些技术减少了训练时间和成本,提升了训练速度,让大规模模型训练更加高效。 1)FlashMLA:高效MLA解码内核 DeepSeek开源周首个项目FlashMLA是针对英伟达Hopper GPU的高效MLA(多头潜在注意力)解码内核,专为优化可变长度序列的推理服务设计。其核心原理借鉴了Flash Attention 2/3的架构,并通过低秩KV压缩技术减少推理时的内存占用,同时在H800平台上实现3000GB/s的内存带宽和580TFLOPS的计算性能。这种性能飞跃源于三大创新:首先,分页KV缓存使显存带宽利用率达到98.7%,较vLLM提升2.3倍;其次,动态负载均衡算法将GPU流多处理器(SM)的空闲周期从18%压缩至2.1%;最后,异步执行引擎成功将GEMM与softmax操作重叠,使计算单元利用率突破75%的理论极限。 图表6分页KV缓存机制 这一技术更新直击AI商业化落地的核心痛点