您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华为]:数据中心自动驾驶网络白皮书 - 发现报告
当前位置:首页/其他报告/报告详情/

数据中心自动驾驶网络白皮书

2022-07-21-华为点***
数据中心自动驾驶网络白皮书

数据中心自动驾驶网络白皮书 01数据中心自动驾驶网络白皮书目录目录CONTENTS1 自动驾驶网络的产生背景和驱动力1.1 数据中心网络的挑战1.2 数据中心网络的机遇1.2.1 人工智能驱动的网络保障1.2.2 数学验证技术的引入1.2.3 意图驱动网络的发展1.3 业界在积极行动1.3.1 行业领导者大力规划实践网络自动驾驶1.3.1 TOP标准组织积极推动网络自动驾驶标准2 华为自动驾驶网络战略解读3 华为数据中心自动驾驶网络方案3.1 整体解决方案3.2 意图决策模块3.3 自动化模块3.4 仿真验证模块3.5 分析模块3.6 数字仓库3.7 用户体验4 华为数据中心自动驾驶网络典型应用场景4.1 规建环节:规划设计仿真并自动验收0303040405050506080811121315161619190404 02数据中心自动驾驶网络白皮书目录目录CONTENTS4.2 维护环节:自动翻译业务意图,自动验收,异常回退4.3 维护环节:网络变更意图buildin,异常快速回退4.4 维护环节:基于意图的网络监控,实现故障闭环4 华为数据中心自动驾驶网络典型应用场景21242629 0301自动驾驶网络的产生背景和驱动力数据中心自动驾驶网络白皮书自动驾驶网络的产生背景和驱动力过去十多年来,数据中心无论在技术还是部署上都在极速发展,日新月异。粗略可以将其划分为三个阶段:•第一阶段是以数据中心大集中(DataCenterConsolidation)为主的DC1.0,对应的网络是传统的二层架构STP+VLAN。•第二阶段是以利用资源虚拟化(Virtualization)和服务动态管理(DynamicServiceOrchestration)为手段,提升资源共享利用率和资源部署灵活度的DC2.0,网络架构演进到全互联的Overlay架构。上述两个阶段技术上最大的分野为云计算技术的日趋成熟和大批量部署•第三阶段是为适应智能化时代所带来的业务量爆发性增长而产生的DC3.0,最大的特点是超大规模和分布式多地多中心,容器、RDMA等各种新技术都在应用中,网络架构的智能化要求也越来越高。总结数据中心的发展趋势,可以看出数据中心发展始终以支撑业务发展为中心,以开放性、高容量、易扩展、成本可控和安全稳定为要求,最终实现业务弹性适配、应用快速部署、信息互通共享、系统分布扩展和负载灵活调度等各种能力的不断提升。这些发展趋势对数据中心的规模、成本、规划设计、部署建设、维护优化、运营管理等各个方面都产生了巨大影响和全新要求。面对这些新要求,当前的数据中心运营管理方案显得力不从心。产业界普遍达成共识,寻求建立一套更加高度智能化的网络管理方案来应对。通过将人工智能、数学验证及意图驱动网络等关键核心技术和理念的引入,我们针对数据中心构建了一套自动驾驶网络方案,围绕全面智能化和自动化的终极目标进行阶段式迭代发展,逐步演进到全面智能自治的数据中心网络。1.1 数据中心网络的挑战•大企业和运营商面临管理大规模网络的诉求,仅靠人工管理很难满足要求,需要引入网络自动化管控系统,自动化配置和编排大规模网络比人工操作更安全、高效。•企业数字化转型对网络敏捷性、可用性等需求日益增加,网络变更频繁,传统运维方式无以为继,急需自动化管控系统能够在网络运行中实时验证网络设计实现状况、及时发现故障,减少业务中断时间。•云应用会跨越异构/多云的基础设施部署,但需要提供一致的网络服务,这就解决异构环境之间网络管理问题,使得用户能够完成以业务意图为导向的统一管控。同时,屏蔽基础设施层不同设备差异以及各种私有接口,进一步地解除厂商绑定。•企业投入成本受限,当前OTT对传统行业冲击巨大。企业面临巨大竞争压力,内在要求提升效率。网络投资也会受投入产出限制,降低OPEX压力越来越大,那么如何降低人工成本、提升网络性能成为CIO必须首要解决的问题。 04自动驾驶网络的产生背景和驱动力•企业投入成本受限,当前OTT对传统行业冲击巨大。企业面临巨大竞争压力,内在要求提升效率。网络投资也会受投入产出限制,降低OPEX压力越来越大,那么如何降低人工成本、提升网络性能成为CIO必须首要解决的问题。1.2 数据中心网络的机遇1.2.1人工智能驱动的网络保障人工智能是一个研究领域,它能赋予机器如人类般的智能。当今网络所产生的海量的配置,状态,告警,日志等运维数据呈指数型增长,数以万计甚至千万计的运维指标远远超出了运维人员可以有效利用的范围,监控阈值不合理或者“报警风暴”甚至对故障的判断产生巨大干扰,人工智能技术为更好地利用网络产生的数据提供了一种可能性。当前,基于人工智能技术对网络数据的分析,能够了解网络环境的复杂性,在网络故障发现,根因定位,网络资源预测等领域已经有了很多应用,显著提升了网络运维的效率。人工智能在网络运维领域的应用已经得到业界的广泛认可,Gartner预测,电信业整体AI市场将以48.8%的年复合增长率从3.157亿美元到2025年增至113亿美元,电信运营商主要将AI用于网络运营监控和管理,此期间这方面支出将占到电信业AI支出的61%。数据中心自动驾驶网络白皮书1.2.2数学验证技术的引入数学验证技术又称为形式化验证,含义是根据某个或某些形式化规范或属性,使用数学的方法证明其正确性或非正确性。形式化验证方法通过严格的数学证明保证程序行为与预期一致,已经广泛应用于正确性要求极高的领域如无人机、航天器、操作系统等的程序正确性验证。在数据中心网络承载关键应用的金融行业,断网的损失高达6.89M美元每小时,而Gartner统计40%的网络事故是由于人工配置错误导致,因此网络配置的正确性的要求越来越高,使用形式化验证方法,可以将网络的配置文件信息和所要验证的预期属性如网络节点间的可达性,隔离性、路径信息(必经节点)、路由黑洞,均转换为一系列逻辑公式,使用数学求解器进行求解,这个方法称为网络变更仿真,可以最大程度的降低配置出错的概率,提升数据中心网络的可用性。1.2.3意图驱动网络的发展意图驱动网络是一种在掌握自身“全息状态”的条件下,基于人类业务意图,借助人工智能技术进行搭建和操作的闭环网络架构。意图网络的概念最早由ONF在2015年2月提出。2017年2月,Gartner发布报告定义了基于意图的网络系统,并预言意图网络系统是网络领域的“下一件大事(Thenextbigthing)”,预计到2020年底,1000+企业将部署意图网络系统。意图网络的目标是网络提供服务能力的进一步增强,以近似于人类语言的方式操作网络。根据定义,意图构成了全网范围的声明性(declarative)策略,人类操作员定义的是预期,而网络计算出可满足要求的解决方案。在数据中心领域,存在大量异构的设备和多云环境,意图驱动网络能够屏蔽这些差异,使网络管理员能够更为专注业务诉求。另外意图网络是一个闭环系统,这里面有两层含义,第一是网络的不断变化不影响已下发的意图,第二是如果监控发现意图不满足,系统需要主动进行调整以确保意图不受影响。 05自动驾驶网络的产生背景和驱动力1.3 业界在积极行动1.3.1行业领导者大力规划实践网络自动驾驶金融:工商银行:工商银行全面布局AIOps智能运维建设,逐步打造“智慧运维”新生态。在数据中心领域,工商银行于2017年下半年建立了面向数据中心大规模集群的云运维体系,提升云上应用自动化、精细化的运维水平,为智能运维的实施提供有力抓手,后续将进一步深化、推进智能运维建设,打造银行业智慧运维,向无人化运维的终极目标持续逼近,助力工商银行建设“智慧、开放、共享、高效、融合”的智慧银行信息系统,数据中心网络的自动驾驶是其中重要的组成部分。运营商:中国联通:提出智能网络战略CUBE-AI,意在以创新技术助力网络智能化和业务智能化的发展,聚焦5G+AI、网络智能运维及行业创新,形成网络人工智能典型应用,迈向网络自动驾驶中国电信:发布CTNET2025网络架构白皮书,全面启动了网络智能化重构,从目前按需、自助、弹性的网络服务向自动化闭环、意愿驱动的网络组织演变。短期目标减少业务发放时间50%-90%,减少中断次数50%。数据中心自动驾驶网络白皮书1.3.2TOP标准组织积极推动网络自动驾驶标准•TMF:发布《自治网络:为电信行业数字化转型赋能》白皮书,首次定义了网络自动驾驶的分级标准,数据中心网络是其认为最适合首先落地自治网络(Automonousnetworks)的领域•ETSI:成立ENI(可体验的智能网络)和ZSM(‘0’接触的网络和业务管理)工作组,专门研究网络智能化,ENI在2017年2月成立,其目标是定义一个感知-适应-决策-执行控制模型的体验式感知网络管理架构,通过人工智能技术提升客户在网络部署和操作方面的体验。其核心理念是网络感知分析,数据驱动决策,基于AI的闭环控制。当前已发布网络智能分级1.0,正式发布写入了数据中心网络智能的分级标准•GSMA:发布《AI使能网络自动化(AI&Automation)》白皮书,认为5G时代需要一个高度智能的自动化网络,并逐步向智能自治网络演进;同时,实现智能自治网络需要“分层自治、垂直协同”的创新架构变革,逐步实现完全自治网络。 0602华为自动驾驶网络战略解读华为自动驾驶网络战略解读实现全自治网络这一终极目标注定是一个长期的过程,需要分步实现。华为基于通信网络的复杂性,从客户体验、解放人力的程度和网络环境复杂性等方面,初步定义了数据中心的自动驾驶网络分级标准,并支持产业各方在级别划分方面最终形成统一的观点:•L0手工运维:所有任务都依赖人执行•L1工具辅助操作运维:少量场景中,系统基于已知重复性执行类、监视类任务提供了工具辅助用户来简化操作、提高重复性工作的执行率。例如,GUI配置向导,批量配置脚本或工具•L2部分自治网络:部分场景中,系统基于网络模型级提供意图交互接口及辅助工具,用户摆脱对设备命令行的依赖,进一步降低了人员对经验和技能的要求;系统可基于一些预定义的静态策略进行固定的监视与分析,由人工决策数据中心自动驾驶网络白皮书级别特征评估维度执行监视分析决策闭环场景意图L0ManualOperation & Maintenance手工操作运维全人工操作人工人工人工人工人工NA设备命令级L1AssistedOperation & Maintenance工具辅助操作运维少量场景基于设备命令行级基础工具辅助,人工分析决策人工为主系统为主人工人工人工少量设备命令级L2Partial Autonomous Network部分自治网络部分场景基于网络模型级标准工具辅助,静态策略分析,人工决策系统为主系统为主人工为主人工为主人工部分网络模型级L3ConditionalAutonomous Network限定条件自治网络特定场景中基于动态策略分析,系统推荐辅助人工决策来实现动态策略的基础闭环系统系统系统为主系统为主系统为主多数网络模型级+业务意图级L4Highly Autonomous Network高度自治网络绝大部分场景中基于业务意图级类自然语言进行交互,系统自动实现动态策略的完整闭环系统系统系统系统系统绝大部分业务意图级L5FullAutonomous Network全自治网络任意场景中系统完成全部闭环系统系统系统系统系统任意业务意图级 07华为自动驾驶网络战略解读•L3限定条件自治网络:特定场景中,系统基于业务意图级提供意图交互接口及工具,大幅降低了用户对网络经验和技能的要求;系统可实时感知环境变化,并基于动态的策略进行监视与突发故障根因分析,给出推荐的决策闭环建议来辅助用户决策,实现基础的闭环管理•L4高度自治网络:大部分场景中,用户可基于业务意图级类自然语言同系统交互,系统通过实时感知环境变化、预测和分析潜在劣化风险、突发故障快速根因分析,并动态自动调整网络参数进行问题修复和优化,实现对网络的完整闭环管理•L5全自治网络:这是数据中心网络发展的终极目标,系统具备在任意场景中跨业务、跨领域的全生命周期的闭环自动化能力,真正实现无人驾驶从分级标准可以清

你可能感兴趣

hot

数据中心数字孪生网络(DCDTN)技术与应用白皮书

信息技术
开放数据中心委员会2022-09-15
hot

数据中心智能无损网络白皮书

开放数据中心委员会2021-09-15
hot

数据中心智能传感网络开放体系白皮书

信息技术
开放数据中心委员会2023-10-08