您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国互联网大会]:计算机行业:DPU硬件标准化的思考与探索 - 发现报告

计算机行业:DPU硬件标准化的思考与探索

计算机行业:DPU硬件标准化的思考与探索

王鹏 中国移动研究院项目经理 1 .D P U技 术 现 状 及 挑 战2 .D P U硬 件 标 准 化 思 考3 .D P U硬 件 标 准 化 探 索4 .中 国 移 动D P U标 准 及 生 态 建 设 •D P U是 继C P U、G P U之 后 的 数 据 中 心 第 三 颗 大 芯 片 , 本 质 是 围 绕 数 据 处 理 提 供 网 络 、 存 储 、 安 全 、 管 理 等 数 据 中 心 基础 设 施 虚 拟 化 能 力 的 专 用 处 理 器•D P U以 数 据 为 中 心 构 建 敏 捷 、 灵 活 、 高 效 的 算 力 基 础 设 施 底 座 , 实 现 极 低 损 耗 、 极 强 性 能 、 极 高 灵 活 、 极 致 安 全 ,支 撑中 国 移 动算 力 网 络 多 样 化 业 务 需 求 极低损耗 极高灵活 裸金属弹性发放网络可编程 各自为营、定向适配的商业模式限制了DPU的产业发展亟需完善技术体系,构建统一软硬件标准,加强产业合作,推动DPU产业生态稳步健康发展 技 术 体 系 产 业 生 态 云 计 算 的 需 求 决 定D P U技 术 体 系 , 云 计 算 新 技 术 、 新场 景 迭 代 频 繁 , 使 得D P U的“易 用 性”成 为 落 地 关 键 D P U与 云 平 台 、 服 务 器 三 位 一 体 共 同 构 成 端 到 端 解 决方 案 , 任 一 环 节 的 缺 失 均 会 影 响 产 业 落 地 Ø技 术 架 构 不 独 立 :D P U本 质 是 云 化 、 虚 拟 化 技 术 从纯 软 件 实 现 向 软 硬 结 合 发 展 的 结 果 , 技 术 架 构 与云 计 算 关 系 密 切 , 耦 合 度 高Ø技 术 路 线 不 明 晰 :D P U在 实 现 某 一 功 能 时 , 存 在 多种 技 术 路 线 , 无 法 收 敛Ø技 术 标 准 不 成 熟 :D P U功 能 与 接 口 缺 乏 标 准 , 硬 件及 服 务 器 多 为 定 制 化 实 现 , 国 内 外 相 关 标 准 组 织刚 刚 起 步 D P U落 地 商 用 需 要云平 台 、D P U、服 务 器三 方 定 向 适 配 , 导 致适 配 时 间 长 、 成 本 高 云平台 DPU 服务器 DPU作为典型的软硬一体解决方案,亟需优先引导整机层及部件层标准化、通用化,为芯片与软件的深度整合及生态繁荣提供底层支撑 服务器整机面对的问题 DPU卡部件可看作在服务器内部的另一个小型服务器。DPU卡的引入对通用服务器设备在多个方面提出了定制化要求 DPU卡部件面对的问题 引入DPU后,服务器内多网卡替换为一张DPU卡。终端客户的组网方案、单节点网络带宽需求、带外纳管方案均存在较大差异,导致DPU卡关键硬件规格难以统一 •服 务 器 硬 件 标 准 化 建 议 分 两 个 阶 段 进 行 推 进 。 于 阶 段 一 优 先 解 决 与 硬 件 设 计 强 相 关 的 结 构 、 供 电 、 散 热 等 需 求 , 于阶 段 二 迈 入 服 务 器 与D P U卡 紧 密 耦 合 的“深 水 区”, 进 一 步 收 敛 两 者 的 在 带 外 纳 管 、 运 维 、 底 层 固 件 的 关 系 。 通 过生 态 标 准 进 行 前 期 引 导 , 待 生 态 成 熟 通 过 企 标 及 采 购 进 行 落 地 •D P U卡 硬 件 标 准 化 建 议通 过 生 态 标 准 优 先 对 卡 硬 件 架 构 、 带 外 纳 管 等 达 成 方 案 级 别 一 致 , 再 通 过 企 标 进 一 步 约 束 端口 数 量 规 格 、 功 能 性 能 等 具 体 设 计 要 求 •在DPU裸金属服务器技术领域,中国移动于ODCC立项《裸金属服务器技术规范》,提出四个统一,旨在实现DPU与服务器设备之间的硬件解耦,及早引导产业进行针对性设计,突破新技术规模应用瓶颈 统一服务器结构及供电最大能力 统一散热能力 •约束服务器支持未开机状态对卡进行散热及调速 •约束服务器可支持卡的最大结构规格及最大功耗门限•约束服务器可支持卡在服务器未开机状态启动 统一硬件辅助边带信号定义 统一带外管理功能边界 •约束服务器能够提供给DPU的辅助边带信号 •逐步收敛DPU及服务器两者带外管理模块的职责及交互框架,最终做到边界清晰 •在服务器与DPU卡紧密耦合的技术领域,DPU卡设备身份的二重性使带外纳管成为首先要解决的问题 •建议从带外管理需求、硬件方案、软件协议逐步达成技术共识,最终实现复杂设备间的解耦 •从终端客户管理运维角度,定义DPU卡带外管理模型•模型既包含卡类信息,又包含主机类信息 •DPU卡内管理信息由带外管理模块统一汇总,避免DPU直接对主机暴露大量Sensor•DPU卡带外管理信息由Smbus或自身带外网口传递 •在Smbus总线基础上,进一步定义双带外管理模块交互协议,实现BMC软件解耦 •在DPU卡技术领域,以全高双宽3/4长PCIe标卡为最大结构,以三颗芯片为核心的DPU卡硬件架构已逐步成为事实标准 •DPU作为软件定义硬件的产品,不同终端客户组网方案导致的DPU端口规格差异,以及不同业务场景对卸载功能性能要求差异,仍需产业共同探讨 中国移动从标准体系构建、产业生态催化两方面进行攻关,推动DPU产业稳步发展打造解耦开放型DPU标准和新生态 发布《DPU技术白皮书》,阐明三大标准化方向 •1套DPU技术架构•5大软件功能接口定义•硬件4个维度统一 •三大定位:产业聚合平台、技术方案实验床、业务场景孵化器•生态聚合:已汇聚28家云平台、服务器、DPU厂商 •CCSA TC1牵头DPU总体技术要求等行标立项•CCSA TC606(ODCC)牵头裸金属服务器技术规范立项