您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开放数据中心标准推进委员会]:光电路交换设备O3S硬件设计规范书 - 发现报告

光电路交换设备O3S硬件设计规范书

AI智能总结
查看更多
光电路交换设备O3S硬件设计规范书

版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 编写团队 项目经理:罗怀健腾讯科技(深圳)有限公司工作组长:何泽坤腾讯科技(深圳)有限公司贡献专家:罗怀健腾讯科技(深圳)有限公司李方超腾讯科技(深圳)有限公司王少鹏中国信息通信研究院孙聪中国信息通信研究院邱奔中国信息通信研究院 前言 随着千亿级参数大模型训练的爆发式增长,智算中心对数据中心互连网络提出了更高的要求。模型并行训练产生的突发性大象流常需跨集群协同传输,静态波分系统面临带宽固化、故障恢复慢、光电转换时延累积等瓶颈,难以支撑高吞吐、低时延、高弹性的网络需求。 光电路交换(OpticalCircuitSwitching,OCS)技术凭借其波长级全光调度能力,尝试打破该瓶颈。在此基础上,我们提出了O3S(Opticalrecoveryopticalroutingopticalswitchingswitch)交换机。O3S一方面通过构建智能化的光层带宽池,将离散波长资源整合为共享带宽池,可快速调配带宽满足大象流需求。另一方面,O3S快速光重建以及无需光电转换的特性,也赋予了DCI波分光互联故障场景快速恢复以及降低光电延时的能力。 本 规 范 书 所 定 义 的O3S硬 件 平 台 , 为 智 算 中 心 构 建 支 持400G/800G超宽谱传输的智能化光互联底座。通过全光交换矩阵、智能管控接口及高可靠架构设计,为大规模AI训练任务提供可靠的传输能力,助力大模型训练效率跨越式提升。 目录 一、背景介绍.........................................................................................................1(一)智算数据中心光互联................................................................................1(二)O3S设计与光信号流................................................................................1(三)应用场景....................................................................................................2二、O3S设备光学指标与功能规范.....................................................................6(一)光学性能指标............................................................................................6(二)环境适应性指标........................................................................................7(三)机械和电气指标........................................................................................7三、O3S设备硬件设计及功能规范.....................................................................8(一)机框硬件设计规范....................................................................................8(二)O3S整机部署..........................................................................................14 图目录 图1O3S上业务波上下行示意图...........................................................................1图2池化网络带宽示意图......................................................................................2图3池化带宽后动态分配带宽示意图..................................................................3图4O3S内部端口映射故障场景...........................................................................4图5波分路径故障场景..........................................................................................5图6机框功能模块满配状态示意图......................................................................8图7O3S机框功能模块满配主视图.......................................................................9图8数据中心互联场景O3S网络设备部署示意图...........................................14 表目录 表1O3S光学性能指标.............................................................................................6表2环境适应性指标...............................................................................................7表3机械和电气指标..............................................................................................7 一、背景介绍 (一)智算数据中心光互联 为了应对智算中心高稳定性要求,我们使用全光恢复/路由/交换机,即O3S设备,赋能网络带宽资源池化能力。在面对光网络平面故障、带宽突发等场景时,O3S设备具备带宽重构能力。秒级光路由重构,协同IP层调整,使得智算互联网络设备能够快速为智算需求提供高质量,低时延的突发DCI带宽,也能积极应对智算中心大象流特征数据需求。 市面上也有不同厂商的光交换产品,不同产品的规格也有所不同。因此本文档提出光电路交换设备硬件的光学指标与功能规范,旨在为行业与生态提供参考,使用户方便选择满足其需求的产品,降低测试与适配的成本。 O3S硬件上的业务波上下行的过程如图所示。其中在上行过程中,业务波从S端口输入,D端口输出。S端口输入后会将业务波映射到48个映射端口中的任意一个。这48个映射端口通过1:3的耦合器耦 合至1路输出,因此总体而言O3S设备具备16端口输入16端口输出,实现了CDC光路由。端口上左图描述了一种业务接入的形式,即3路业务耦合到同一路输出。相较于每个端口独立映射输出的方式,此方案在输出端节约了2/3的光纤,有利于布线效率的提升。但需要注意此时S1-S3成为了一个耦合组,输入信道需提前规划为不同波长。 在下行过程中,传输和上行对称。由于1:3分光器的存在,每个下行S端口均会输出3个波长,通过相干接收即可过滤掉非本端业务波。此外,1:3分光器和耦合器会引入大约6.5-8db插损。它叠加上光交换设备原本的3-4db插损,会对业务波造成较大衰减,建议在波分侧引入增益为9.5~12db的放大器对信号进行放大。 (三)应用场景 1.多维度数据中心互联带宽池化 如图所示,在四园区智算中心光互联中,园区之间均可建立两两之间互联的带宽。但在传统DCI场景中,互联带宽是固定的,无法动态调整。例如从D园区有19.2T的突发带宽要前往A园区,但在 建设阶段只给DA方向分配了12.8T的带宽,那么就需要在数通层面上进行流量转发,通过增加跳数绕行的方式从B-D-A的方向转发额外的6.4T带宽。这样做会增大带宽的时延。但具备了全光交换能力后,可以在D园区流量出口前建立池化带宽,可以将前往三个园区的流量整合起来,根据大象流需求进行路由重构,直接将19.2T的带宽动态分配到DA波分系统上。这样既满足了流量需求,也能减低转发时延。 来源:Tencent,传送网络组 如上图所示,可以只需通过调整交换机上DCO的相应波长,并在O3S设备上重建光路映射(O3S设备内从虚线到红线),来实现临 时带宽扩容。同时,无需做任何改纤的调整,这对于扩缩容的人力资源节约和效率提升都是极大的。 另外,由于O3S设备具备快速的切换时间(通常小于50ms),可用于快速故障自愈。如图,当检测到设备上某对光端口(第一个输入端口到第一个映射端口)之间光路故障时,可以快速切换到其他冗余的端口映射对上。上图例子中,寻找到冗余的中间映射端口后,就可以重新建立从第一个输入端口到第三个映射端口之间的光路。同样地,若波分链路出现光纤故障,也可通过映射对调整快速利用冗余平 面或链路对光信号进行承载。如下图所示,所有通过映射连接到波分路径1的信号,都可以通过改变映射光路的方式,重建到第二条波分路径上。这种自愈能力对于维持网络的高可用性和稳定性至关重要。 来源:Tencent,传送网络组 二、O3S设备光学指标与功能规范 (一)光学性能指标 表1O3S光学性能指标 (二)环境适应性指标 (三)机械和电气指标 三、O3S设备硬件设计及功能规范 (一)机框硬件设计规范 1.概述 O3S机械框架用于容纳所有功能模块并实现模块间的电气互联。该机框高度为2RU,可安装于标准服务器机架或600毫米深的机柜中。机框采用全无源组件设计,具备高可靠性。 左侧槽道为工艺接口模块(CIM)的专用安装位,该模块安装后可对外提供以太网(ETH)、控制台(CON,RS232)及USB接口,满足设备本地运维所需的各类接口需求。右侧槽道用于安装光交换引擎板卡,该板卡主要承担光通道的交互与切换功能。光引擎板卡与机框间采用专用锁附结构实现稳固连接,不支持常规插拔操作。 机框背面的模块配置遵循功能适配原则,支持单控制单元(CU)、双电源模块(PSU)及双风扇模块(FAN)的安装布局。其中,风扇模块与电源模块均采用冗余设计:在风扇模块方面,双模块协同运行时可实现1+1冗余,若单模块发生故障失效,另一模块能即时补位维持散热效能;电源模块同样支持1+1冗余备份,单模块故障时,备用模块可快速切换以保障供电连续性,二者均能在短时间内承受单模块故障带来的运行压力,确保机框核心功能不受影响。 需注意的是,该机框在架构设计上不支持堆叠部署。安装环节需严格遵循以下规范:优先选择将机框固定于标准机架或机柜内部,通过配套安装件实现稳固支撑,避免因安装不稳导致的运行晃动;若因场景需求需采用平放方式,应直接将机框放置于平整桌面,严禁进行堆叠操作,防止堆叠产生的压力