您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华为]:迈向智能世界白皮书2024全光网络 - 发现报告

迈向智能世界白皮书2024全光网络

信息技术 2024-12-16 华为 尊敬冯
报告封面

全光网络 光联万物,光感万业使能绿色智能世界 深圳龙岗区坂田华为基地电话:+86-755-28780808邮编:518129www.huawei.com 商标声明 ,,是华为技术有限公司商标或者注册商标,在本手册中以及本手册描述的产品中,出现的其他商标,产品名称,服务名称以及公司名称,由其各自的所有人拥有。 免责声明 本文档可能含有预测信息,包括但不限于有关未来的财务、运营、产品系列、新技术等信息。由于实践中存在很多不确定因素,可能导致实际结果与预测信息有很大的差别。因此,本文档信息仅供参考,不构成任何要约或承诺,华为不对您在本文档基础上做出的任何行为承担责任。华为可能不经通知修改上述信息,恕不另行通知。 版权所有©华为技术有限公司 2024。保留一切权利。非经华为技术有限公司书面同意,任何单位和个人不得擅自摘抄、复制本手册内容的部分或全部,并不得以任何形式传播。 目 录 CONTENTS 前言03 06光网络十大趋势 07趋势一智能应用驱动数据中心朝着多层次、分布式的架构演进,骨干网将走向400G立体联算,实现6个9高可靠无阻塞的高品质算间互联15趋势三智算集群需突破传统交换机网络带来算力规模和功耗的限制,智算集群将走向光电混合DCN组网24趋势六Apple Vision Pro革新家庭娱乐体验,加速FTTR全光底座向FTTR+X智慧家庭中枢演进,支撑更多家庭智能应用创新18趋势四光接入网正加速迈向50G PON和Wi-Fi 7时代,实现从千兆到家向万兆到房升级27趋势七光网络管控平台需引入AI技术实现智能化升级和用户的体验保障33趋势八光进铜退正在从家庭走向园区,全光园区2.0构建园区数智化底座39趋势九光进电退,行业数智化升级催生行业生产通信网新标准fgOTN,加速行业生产通信网升级44趋势十智能化时代,光纤、视觉、雷达等能够多维度感知信息,通过AI加持,能实现更加精准的智能远程作业,实现光进人退11趋势二智能应用的发展对入算网络联接的品质要求越来越高,城域网将走向1ms一跳入算21趋势五智能应用的涌现要求品质可保障的泛在算力接入,驱动光接入网架构从“尽力而为”走向“确定性体验” 前言 展望未来,ICT 产业最重要的变化就是智能化。根据机构预测,全球智能化相关投资复合增长率达到 26.9%,大模型,终端的成熟带来了 AI 应用的蓬勃发展,智能化正在加速走进个人、家庭和企业。在个人和家庭领域,苹果智能、AI 助理、云电竞、云电脑、智能家居等智能业务提供的全新的娱乐和生活的交互体验,传统的居住生活空间正在快速演变成极致体验的智能空间。在企业领域,头部互联网企业纷纷竞逐 AI 大模型,政府和金融紧跟步伐积极布局智能化,包括政务的灾害预测、治安风险防控和金融的智能风控、智能营销等,制造、电力等行业也开始尝试 AI 应用,华为盘古模型面向 32 个行业已发布了 400 多个智能应用。以人工智能为核心的新一轮工业革命正在发生,用 AI 赋能千行万业,数智化生产的实现,将驱动人类文明指数级的增长,带来数万亿的行业新价值。 智能化时代,企业、家庭、个人像用电一样随时随地高品质接入智能世界,将给光通信产业带来了三大挑战和机遇: 其一是算力承载网如何使能以网强算?随着智能时代的到来,企业、家庭、个人应用的智能化对网络联接的品质要求越来越高,驱动数据中心正朝着多层次、分布式的架构演进,如何满足不同业务对带宽和时延的差异化品质需求和各算力中心之间的高效协同,我们认为需要建设一张高品质全光运力网络。 其二是宽带网络如何满足智能应用的确定性体验要求?智能应用的创新进入规模爆发期,苹果智能、AI 助理、云电竞、云电脑、智能家居等等创新应用的出现,正驱动宽带网络从“联接”向“联接 + 算力 + 应用”一体化服务演进,并对光接入网提出确定性体验的要求。我们认为需要定义全光万兆的目标架构,打造泛在算力接入的最佳入口,为家庭、中小企业、园区、城市数智化等提供可承诺的上云入算和高品质接入服务。 前言 其三是如何支撑行业的数智化转型?行业的数智化转型,对数据的感知和传输提出了更高的要求。例如,医院的 AI 辅助阅片、学校的 VR 教学等场景,在极大的提升生产效率的同时,对园区网络带宽和联接数量等提出十倍以上的要求,我们认为光产业面向行业用户将迎来“三进三退”新发展机遇。 这将带来光通信产业发展的十大趋势: 趋势一:智能应用驱动数据中心朝着多层次、分布式的架构演进,骨干网将走向 400G 立体联算 趋势二:智能应用的发展对入算网络联接的品质要求越来越高,城域网将走向 1ms 一跳入算 趋势三:智算集群需突破传统交换机网络带来算力规模和功耗的限制,智算集群将走向光电混合 DCN 组网 趋势四:光接入网正加速迈向 50G PON 和 Wi-Fi 7 时代,实现从千兆到家向万兆到房升级 趋势五:智能应用的涌现要求品质可保障的泛在算力接入,驱动光接入网架构从“尽力而为”走向“确定性体验” 趋势六:Apple Vision Pro 革新家庭娱乐体验,加速 FTTR 全光底座向 FTTR+X 智慧家庭中枢演进,支撑更多家庭智能应用创新 趋势七:光网络管控平台需引入 AI 技术实现智能化升级和用户的体验保障 趋势八:光进铜退正在从家庭走向园区,全光园区 2.0 构建园区数智化底座 趋势九:光进电退,行业数智化升级催生行业生产通信网新标准 fgOTN,加速行业生产通信网升级 趋势十:智能化时代,光纤、视觉、雷达等能够多维度感知信息,通过 AI 加持,能实现更加精准的智能远程作业,实现光进人退 02 全光网络十大趋势 趋势一 智能应用驱动数据中心朝着多层次、分 布 式 的 架 构 演 进 , 骨 干 网 将 走 向400G立体联算,实现6个9高可靠无阻塞的高品质算间互联 背景/趋势 随着 AI 应用快速发展,数据密集型业务占比越来越高,为了更好满足新业务的差异化体验,全球数据中心架构正在向多层次、分布式转变,这将带来数据中心间网络流量的快速增加,根据第三方报告预测,2030 年 AI 将贡献 72% 新增的网络流量,AI 流量年增长超过 36%。 智能时代的数据中心架构大致可以分为三层,区域 DC 用于 AI 大规模训练、数据备份等,核心 DC 用于公有云、行业云等,边缘 DC 用于 AI 实时推理、视频解码等。在中国,中国移动、中国电信、中国联通等运营商相继发布了覆盖全国的层次化、分布式的 DC 部署规划;在欧洲,欧盟数字指南针计划到 2030 年部署 10,000 个边缘节点,其分布方式将确保无论企业位于何处,都能以低延迟获得服务,同时围绕现有 5 大核心数据中心进一步扩展出 41 个区域数据中心。 同时随着 AI 大模型持续迭代升级,需要消耗巨大算力,单个 DC 性能、空间、功耗受限,在此背景下,OTT 和运营商开始考虑通过网络将多个智算中心进行联接,实现跨 DC 训练,如Open AI 针对 ChatGPT6 模型超大算力需求,认为在训练时必须考虑单个区域电网承载能力的限制,通过跨州算力中心进行训练;北京电信已经在瀛海,武清,永丰做了百公里跨区域智算中心协同训练测试,将三个区域的数据中心近百卡算力联接起来实施协同训练,整体性能损失在 5% 以内。 根据华为《智能世界 2030》报告预测,未来三年内,全球超大型数据中心数量将突破 1000 个,并将保持快速增长;同时,随着自动驾驶、智能制造、元宇宙等应用的普及,边缘数据中心将同步快速增长,未来以 DC 为中心的业务成为主流趋势。这将给网络带来新的需求:首先是带宽,不同数据中心之间的带宽需求普遍将达到 Tbps 级别,智算拉远等场景甚至可达百 Tbps 以上;其次是时延,算力一体化联接对网络时延的要求低至 ms 级,国内三大 T 均已明确提出 1-5-20ms 三层时延圈建网理念;最后是可靠性,算力承载网必须超高可靠,随着数据中心数据量的增大,单次算力训练中断就会带来超过百万人民币的损失。我们以智算中心分布式拉远场景为例,他对网络有极高的要求:首先是带宽:大模型万卡集群,每张卡带宽 200Gbps,极端情况下流量瞬时突发达上千 Tbps,通过优化集合通讯库感知到长、短距,可以降低长距通信量;经过计算仿真,百公里距离情况下,百 T 级带宽可支撑万亿模型。其次是 RDMA 无损传输:AI 训练的采用 RDMA 协议,对于丢包极为敏感,百分之一丢包导致网络吞吐下降为 0。 应对方案 随着 130G+ 波特率光器件产业链成熟 , 干线网络已正式迈入 400G 新代际,通过 400G 速率替代传统 100G/200G 速率,单 bit 成本降低 30% 以上 , 占用波长数量的减少也使运维成本的降低,带来非常可观的技术红利。最后,在可靠性方面,基于光电协同 ASON 多路径保护,自动对备份路由进行恢复,网络抗多次光纤中断,每次倒换时间小于 50ms,保障网络99.9999% 超高可靠 , 做到算力联接有路自通。 为了应对数据中心分层分布式部署带来的挑战,我们认为需建设一张 400G 立体联算骨干网,他主要包含三个方面。首先,在架构方面,基于 3D-Mesh 立体架构,骨干网节点之间以光缆最短距离组网,并且在热点区域叠加超高速光平面,利用 20/32 维 OXC 及其灵活调度能力将平面交通升级为立体交通,解决热点区域容易出现网络拥塞的问题,为算力中心之间构建起数据“高速公路”。其次,在带宽方面, AI 训练采用 RDMA 协议,对于丢包极为敏感,百分之一丢包导致网络吞吐下降为 0 大模型万卡集群,每张卡带宽 200Gbps,极端情况下流量瞬时并发达上千 Tbps 应用实践 湖南某运营商为了实现全省算力一体化建设,打造了一张覆盖全省的全光品质运力网。通过全Mesh 化架构建网,围绕省内算力中心布局,将省干 / 地市本地网融合成一张网,减少路由迂回;通过 OXC 全光调度覆盖全省 15 个数据中心和产业园区;构建了长株潭 1ms,全省 3ms 时延圈。支撑全省算力一体化的高品质联接,支撑面向未来的大模型训练等算力应用的发展。 趋势二 背景/趋势 智能应用的发展对入算网络联接的品质要求越来越高,城域网将走向1ms一跳入算 AI 终端和大模型正在快速发展,多数智能终端厂商都会在未来几个月推出 AI 手机和 AI 电脑,Canalys 近日发布了一份关于《AI 手机的现在和未来》的报告。报告指出,2024 年全球 16% 的智能手机出货为 AI 手机,到 2028 年,这一比例将激增至 54%。今年 H1,Sora 和 ChatGPT-4o 等 AI 大模型在多模态和实时交互方面都有飞跃式提升,明年千亿参数模型将进一步成熟、万亿参数模型将开始训练,这些都在加速 AI 应用进入全面普及的时代。今年以来 ChatGPT 智能聊天应用月活用户突破 1 亿,面向行业基础办公的智能应用 Copilot 也已超过 5 万 + 企业订阅,三个月增长了 70%,预计明年不同行业的核心生产领域也将迎来智能应用的快速发展。 智能应用的发展给网络带来更多流量和确定性时延等新的需求。以 apple intelligence 为例,30 亿参数以上的模型推理依赖云端算力,要与端侧实时协同,这带来频繁的数据传输需求,这类端云协同的智能应用将带来流量的快速增长。 以云电竞等渲染类应用为例,由于本地仅部署显示器和瘦终端,存储和渲染等其他功能均在云端算力中心完成,网络需提供确定性低时延以确保最终用户体验。 应对方案 为了保障智能应用体验,我们认为需要建设 1ms 一跳入算的城域网,他包含两个方面,要从一横一纵两个方向进行架构升级。首先,横向构建城域核心 Full-Mesh 网络, 解决环网架构下 DC互联路由绕路带来的高时延问题,使 DC 间路由一跳直达,实现算间稳定的低时延互联,同时随着路由优化,可以利用 130G+ 波特率产业链在城域实现 800G~1.2