您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中国信通院]:DPU 发展分析报告(2026年) - 发现报告

DPU 发展分析报告(2026年)

信息技术 2026-05-15 - 中国信通院 杨框子
报告封面

版权声明 本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。 前言 当前,全球数字经济加速发展,以大模型、智能体为代表的新一代人工智能技术加速落地,智算需求爆发式增长。作为智算设施的重要组成,数据处理器(Data Processing Unit,DPU)凭借软硬协同的专用加速能力,实现网络、存储、安全等任务的高效卸载,破解传统计算架构的性能瓶颈,助力算力资源的高效调度,降低系统总拥有成本,为模型训练、应用推理、边缘计算等场景提供支撑,被业界认为继CPU、GPU之后“第三颗主力芯片”。 DPU产业正由高速发展向高质量发展全面演进,从政策方面看,全球主要经济体积极推动产业发展,美国、欧洲等国家在“创世纪计划”、《芯片法案2.0》等中强调要推动涵盖DPU在内的半导体发展,我国通过《算力基础设施高质量发展行动计划》、算力强基揭榜行动等政策牵引DPU研发应用。从技术方面看,DPU架构不断演进,通过硬件级卸载释放CPU、GPU潜能,依托高速接口技术实现数据高效传输,解决AI训练和推理中的网络瓶颈问题。从产业方面看,通用算力中心、智能算力集群、5G边缘计算等多样化场景逐步应用DPU,为产业发展提供有效的需求牵引。未来,DPU架构将不断迭代创新,加速场景渗透,释放应用价值。 本报告立足产业发展,系统梳理DPU发展背景、行业动态与市场环境,研判未来趋势,并提出针对性建议,旨在全面呈现全球及我国DPU产业发展全貌,为政策制定、技术研发与生态构建提供参考,助力我国DPU产业发展,筑牢数字经济高质量发展的算力之基。 时间仓促,报告仍有诸多不足,恳请各界批评指正。后续我们将不断更新完善,如有意见建议请联系中国信通院研究团队:dceco@caict.ac.cn。 目录 一、DPU发展概述..................................................................................................... 1 (一) 全球强化政策引领,夯实发展根基....................................................... 1(二) 技术驱动架构升级,成为主力芯片....................................................... 2(三) 核心场景率先突破,行业渗透深化....................................................... 5(四) 多重瓶颈叠加制约,发展仍待突破....................................................... 6 (一) 计算架构持续迭代,体系效能全面升级............................................... 7(二) 端网融合深度推进,传输时延显著降低............................................... 8(三) 高速存储加速成型,卸载能力关键跃升............................................... 9(四) 互联技术持续优化,集群算力高效协同............................................. 11(五) 软硬协同创新突破,技术标准加速落地............................................. 12 三、DPU产业生态发展分析................................................................................... 13 (一) 架构革新与智能融合并进,突破效能瓶颈制约................................. 21(二) 场景渗透与价值释放加速,赋能行业转型升级................................. 23(三) 体系构建与生态协同提速,规范产业发展秩序................................. 23 图 目 录 图1 DPU功能示意图.................................................................................................. 4图2通用CPU+FPGA(左)和CPU+ASIC(右)实现DPU示意图...................7图3 AI推理上下文存储流转机制............................................................................ 11图4 DPU产业魔力象限............................................................................................ 16 一、DPU发展概述 当前,随着数字经济的持续发展,尤其是大语言模型、自动驾驶、具身智能等应用加速落地,智算需求爆发式增长。作为算力中心的“第三颗主力芯片”,DPU重要性不断凸显,从早期面向网络、存储、安全等卸载功能,逐步升级为支撑算力基础设施建设的重要硬件底座。 (一)全球强化政策引领,夯实发展根基 美国、欧盟等相继出台产业战略,围绕半导体加大算力研发布局,抢占技术主导权。2025年11月,美国联邦政府正式启动“创世纪计划”(Genesis Mission),12月美国能源部联合26家科技企业和机构签署合作备忘录,计划将“半导体与微电子”列为优先突破领域之一,为包括DPU在内的相关芯片技术的研发、制造和应用提供顶层的战略支持和潜在的资源倾斜。同年,欧盟启动《芯片法案2.0》修订进程,明确加大AI芯片、先进互连、光封装、算力卸载芯片资金倾斜,优化审批与人才体系,进一步强化数据中心专用微电子技术主权布局。2025年12月,韩国公布700万亿韩元长期投资规划,目标建成全球最大芯片产业集群,抢占AI芯片竞争优势 我国高度重视DPU产业发展,已构建起国家与地方协同推进的政策体系,有力推动产业规模扩张与技术创新突破。国家层面,2023年10月,工业和信息化部等六部门印发《算力基础设施高质量发展行动计划》提出开展DPU、无损网络等技术升级与试点应用,实现算力中心网络高性能传输。2025年2月,工业和信息化部启动算力强基揭榜行动,开展基于芯粒(Chiplet)和RISC-V(Reduced Instruction Set Computing-V,第五代精简指令集计算)技术的软硬件一体DPU芯片技术研究。2025年8月,国务院发布《关于深入实施“人工智能+”行动的意见》,其中提到支持人工智能芯片攻坚创新与使能软件生态培育,加快超大规模智算集群技术突破和工程落地。2025年9月,工业和信息化部征集“重点产品、工艺‘一条龙’应用计划”的推进机构,明确将DPU列为关键产品,提出要“围绕DPU应用需求,开展基于国产工艺的高性能可编程数据处理器的研制、操作系统(OS)子系统升级与硬件扩展”,并推动其在云计算、高性能计算、AI等领域的应用。地方层面,上海、深圳等地纷纷出台行动计划。2025年10月,上海市发布《上海市智能终端产业高质量发展行动方案(2026—2027年)》,旨在加强端侧人工智能芯片的布局,推动产业规模突破。2026年 , 深 圳 市 印 发 《 深 圳 市“人 工 智 能+”先 进 制 造 业 行 动 计 划(2026—2027年)》,构建人工智能与半导体产业“双向赋能”的生态,通过AI技术提升芯片设计、制造全流程效率,以破解高端自主不足的瓶颈。 (二)技术驱动架构升级,成为主力芯片 随 着 算 力 需 求 的 多 元 化 与 高 性 能 计 算 的 快 速 迭 代 , 传 统CPU + GPU的双核架构已难以适配高带宽、低时延、强安全的需求,推动计算架构向“通用+专用”协同转型。DPU通过在硬件层面实现网络协议栈、低时延RDMA传输、存储I/O、加密解密等功能的专用加速,并在AI集群中承担构建推理上下文内存存储平台、卸载非计算任务释放GPU算力、承担机架内数据神经中枢等功能,提供可编程 的算力中心基础设施软件栈,实现对算力资源的细粒度调度与动态优化。近年来,NVIDIA多次在GTC等技术大会上强调DPU的重要性,并已在DGX AI超级计算机和Spectrum-X网络平台中规模化部署,DPU在算力基础设施中的战略性地位持续提升。 从技术层面看,DPU通过硬件级卸载网络、存储及安全任务,有效释放CPU与加速器的算力。DPU可采用芯粒(Chiplet)设计,集成专用网络处理单元、可编程计算核心与高速I/O接口,通过片上互连网络实现内部功能模块的高效协同。在互联架构层面,DPU重点支持单节点内Scale-Up与跨节点集群Scale-Out互联,依托远程直接内存访问(Remote Direct Memory Access,RDMA)等先进协议,实现GPU间的低时延、高吞吐数据交换,缓解万卡级AI集群的通信瓶颈。此外,DPU依托软件定义技术,在云计算领域优化虚拟化效率。同时,通过集成网络处理、计算加速、本地存储及安全防控等功能,满足5G、智算中心等高带宽、低时延、高吞吐应用场景需求,推动计算与网络深度融合。 从应用价值看,DPU已超越基础的“降本增效”。在AI推理与超大模型训练场景中,其核心作用演变为重构数据路径与内存层级,以系统级优化直接释放算力红利。DPU通过构建池化的“推理上下文内存”,将海量KV Cache从GPU-HBM卸载至由其统一管理的大容量NAND资源池,解决了上下文长度快速扩张带来的KV Cache容量爆炸、访存压力剧增与算力效率急剧下降的问题,降低单次推理的数据搬运与预处理功耗,缩短训练周期并降低单词元(Token)推理成本。同时,DPU作为智能的数据调度中枢,实现对存储I/O、安全协议及虚拟化功能的彻底卸载与硬件加速,使CPU与GPU专注于核心计算本身,在提升算力中心整体性能与利用效率的同时,有效降低硬件冗余与总体能耗。 (三)核心场景率先突破,行业渗透深化 DPU作为算力基础设施的核心组件,在互联网、金融、能源等关键行业实现规模化落地,已从单一功能加速设备,发展成为覆盖多场景、全链路的算力核心处理器之一。在算力建设方面,DPU聚焦云计算、大数据和人工智能等场景,利用硬件卸载网络转发、存储虚拟化及安全隔离等基础设施负载,有效解决性能与安全难以兼顾的难题。目前,全球头部云厂商已完成规模化部署,国内阿里云、腾讯云、华为云等企业在新一代服务器中实现DPU标准化落地,推动DPU从可选加速部件向算力中心的基础标配器件转变。 在互联网领域,DPU赋能高并发业务,提升服务体系效能。DPU已广泛应用于搜索引擎、电商交易、在线视频、社交媒体等各类高并发在线服务体系,成为头部平台降本增效、优化用户体验的核心抓手。在搜索引擎场景中,通过硬件加速用户请求的转发、处理与响应,提升检索效率与结果反馈速度,同时降低后端服务器的算力开销,支撑海量用户的实时交互通信、内容分发与数据共享,优化终端用户体验。 在金融领域,DPU筑牢安全防线,保障核心交易高效运行。针对高频交易、实时风控及跨境支付等核心场景,依托微秒级低时延、硬件级安全隔离及全链路可审计能力,精准匹配金融行业对效率与合规的要求。在证券高频交易中,DPU将端到端时延压缩至亚微秒级,提升交易执行效率。目前,DPU已广泛应用于银行、证券、保险机构的私有云及核心系统建设,成为金融关键