AI智能总结
开放数据中心标准推进委员会ODCC2025年9月 版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 编写团队 项目经理:郑秀丽华为技术有限公司工作组长:郭亮中国信息通信研究院贡献专家:郭亮中国信息通信研究院李洁中国信息通信研究院李虎百度在线网络技术有限公司王正斌快手解云鹏中国电信股份有限公司研究院刘畅中国联合网络通信有限公司研究院杨凯上海合见工业软件集团有限公司任首首华为技术有限公司曾高雄华为技术有限公司谢丽娜中国信息通信研究院李佳媛中国信息通信研究院何宗应博通公司汪硕北京邮电大学陈凯香港科技大学吴文斐北京大学王俊杰苏州盛科通信股份有限公司 王少鹏中国信息通信研究院韩博文中国联合网络通信有限公司研究院陈哲华为技术有限公司孙黎阳华为技术有限公司楼哲华为技术有限公司周栋北京邮电大学李文雪香港科技大学张君逸华为技术有限公司杨飞华为技术有限公司韩思雨北京邮电大学林培源北京邮电大学钟蔚北京邮电大学杨勇涛苏州盛科通信股份有限公司 前言 随着人工智能(ArtificialIntelligence,AI)大模型的兴起,AI大模型训练对底层的算力网络提出了越来越高的要求。一个实时、高效、可靠的算力网络能够提升AI算力中心的计算效率,其中网络传输协议及相关技术作为支撑算力网络的关键技术之一,面临着极大的挑战(如高效拥塞控制、多路径负载均衡等)。为了应对这些挑战,中国信息通信研究院、华为技术有限公司联合ODCC其它合作伙伴提出了AI原生传输技术,实现AI超大集群网络场景下(ScaleOutNetwork)的长距离、高性能网络传输。AI原生传输技术测试规范是在AI原生传输技术发展取得一定进展后制定的,有助于助推AI集群网络的进一步发展。本规范规定了测试AI原生传输技术的环境、设备、工具、业务场景及相关测试例。 目录 一、测试环境......................................................1 (一)测试网络拓扑.............................................1(二)配合设备.................................................1(三)测试工具.................................................1(四)业务场景.................................................2 (一)流量哈希冲突场景测试.....................................2(二)带宽不对称场景测试.......................................4(三)与传统FairSharing调度对比测试..........................7(四)与传统Lossless技术路线对比测试..........................8(五)AI原生传输技术压力测试.................................12 图目录 图1网络拓扑图...................................................1 表目录 表1配合设备列表..................................................1表2测试工具列表..................................................1 一、测试环境 (一)测试网络拓扑 为了便于实际的测试操作,降低测试环境的准备门槛,本规范采用了较小规模的测试环境,并且在测试例中通过permutation流量的方式来模拟真实大模型训练或推理中的局部流量冲突。在具备大规模组网的测试环境条件下,也可以基于本测试规范提供的测试例的基本原理,构造新的更大规模的测试用例。 (二)配合设备 (三)测试工具 (四)业务场景 AI原生传输(AI-NativeTransport,以下简称ANT)技术,旨在面向Scaleout超大集群智算网络,通过逐包均衡、算效优先CFS(Computation FirstScheduling)、数控分离DCP(DataControlPartitioning)等技术创新,提升带宽利用率、降低训练时间。本测试规范在Scaleout超大集群智算网络中对ANT进行了各种不同的测试,并与其它已有的传输技术做对比。 二、测试例 (一)流量哈希冲突场景测试 8台服务器,4台交换机,2层无收敛组网。 测试方案如下: 1.采用单路径ECMP选路,观察8条流的吞吐。 2.使用业界端侧逐包负载均衡方案(UEC为例),观察8条流的吞吐。 1、单路径ECMP方案中,无hash冲突的流能够充分利用带宽,另一些流由于ECMP冲突,单流吞吐大幅下降。 2、各逐包均衡方案中,8条流的平均吞吐优于方案1。 (二)带宽不对称场景测试 8台服务器,4台交换机,2层无收敛组网,如图所示的T0-S0的某条链路双向带宽降为10%,模拟链路故障。测试步骤: 端侧逐包负载均衡方案的吞吐。逐包均衡下,由于链路故障或背景流等导致网络带宽不对称时,测试ANT能否有效避免拥塞扩散。 测试环境: 8台服务器,4台交换机,2层无收敛组网,如图所示的T0-S0的某条链路双向带宽降为10%,模拟链路故障。 测试步骤: 使用perftest打流,在8节点间进行Permutation流量测试,具体流量流向为:H0->H4,H1->H5,H2->H6,H3->H7,H4->H1,H5->H2,H6->H3,H7->H0。 测试方案如下: 1.使用网侧AR均衡方案,观察8条流的吞吐。 2.使用ANT逐包负载均衡选路,观察8条流的吞吐。 预期结果: 1、网侧AR均衡方案中,8条流的平均吞吐明显低于测试例1中相同方案的性能。 2、ANT逐包均衡方案中,8条流的平均吞吐略低于测试例1中相同 (三)与传统FairSharing调度对比测试 2)H4->H2,H5->H3,100~200MB数据,模拟可被掩盖流量,如DP 等 对比方案: 1)传统FairSharing方案 (四)与传统Lossless技术路线对比测试 8台服务器,4台交换机,两层Leaf-Spine拓扑,100Gbps组网。 测试步骤: 训练多任务下,不同主机多打一测试流(任务一DP+PP流量),叠加一条受害流(任务二SP流量),测试不同方案下,受害流吞吐/完成时间。具体地, 1)Lossless方案 2)Loss-tolerant方案:ANT-DCP 预期结果: 1)Lossless方案和ANT-DCP方案中,测试流F1、F2和F3均分瓶颈链路带宽,且瓶颈链路带宽利用率很高。 2)Lossless方案由于PFC头阻问题,导致受害流F4有效吞吐远 8台服务器,4台交换机,两层Leaf-Spine拓扑,100Gbps组网。 (五)AI原生传输技术压力测试