您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国移动]:NFV硬件加速技术白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

NFV硬件加速技术白皮书

电子设备2020-06-19中国移动甜***
NFV硬件加速技术白皮书

中国移动NFV 硬件加速技术白皮书 (2020年) 中国移动通信集团有限公司研究院 2020年6月 中国移动NFV硬件加速技术白皮书 I 前 言 运营商网络功能虚拟化(Network Function Virtualization, NFV)首先考虑业务发展和云化的需求。电信业务种类丰富,包括核心网、无线接入网、承载网、传输网、业务平台等多个领域的电信网元都可以采用云化方式部署,各业务在部署位置和资源需求等方面往往存在较大差异,因此业务云化的趋势也是多样化的。 考虑到电信业务云化的效益、难度、可靠性要求,以及云化后的稳定性,目前各大运营商均优先从业务需求迫切、云化难度较小、易于集中化和规模化部署、资源需求较为一致和易于资源共享的业务入手推进业务云化。这类业务主要集中在核心网控制面,如IMS、EPC控制面、PCC、短信、智能网、能力开放等领域,此类业务对云资源池的要求较为一致,适合集中化部署在大规模的网络云中,通过云化实现业务的灵活部署和资源最大程度的共享。 但伴随着5G技术的快速发展和边缘业务的兴起,业务边缘部署需求日益增加,在智能制造、智慧城市、车联网、云游戏、AR/VR等各个垂直领域,时延与带宽成为此类边缘业务的核心关注点。以UPF为例,边缘业务对UPF的要求为在承载百万级用户量的前提下,其端到端转发时延要求不超过10ms,带宽要求在50Gbps以上,核心网UPF带宽甚至要达到300Gbps。同时,边缘云节点在空间和供电、承重等方面存在着很强物理约束,这个特点使得原本核心云端的无限资源模式、大规模部署成本效应淡化,因此在边缘云具体部署实现时,必须需要考虑在有限空间、供电资源、承重能力这些前提下,如何满足业务的性能需求。 中国移动NFV硬件加速技术白皮书 II 为满足5G uRLLC、eMBB以及网络切片场景下边缘多样化业务的部署需求,在边缘节点有限的资源环境下实现大带宽、低时延、高可靠的网络功能,硬件加速技术应运而生。 本白皮书以边缘计算发展理念为基础,以网络转型需求和业务发展趋势为指引,向业界系统阐释中国移动NFV硬件加速的整体架构、关键技术及发展方向。中国移动倡议业界联合对硬件加速技术的方案、架构、演进路线等进行深入研究和实践,共同推进硬件加速技术的成熟,更好的支持边缘场景的业务发展和网络转型。 中国移动NFV硬件加速技术白皮书 III 目 录 1 硬件加速技术概述 ................................................................................................... 1 1.1 NFV硬件加速产生的背景 ........................................................................................................ 1 1.2 硬件加速技术在产业的应用 ................................................................................................... 3 1.3 NFV硬件加速标准和开源进展 ................................................................................................ 5 1.4 NFV业界硬件加速应用现状 .................................................................................................... 7 2 中国移动NFV硬件加速需求分析 ........................................................................... 8 2.1 数据通路硬件加速需求分析 ................................................................................................... 9 2.2 UPF硬件加速技术需求分析 ................................................................................................... 11 2.3 边缘应用硬件加速技术需求分析 ......................................................................................... 13 3 中国移动NFV硬件加速整体架构 ......................................................................... 13 4 中国移动NFV硬件加速关键技术 ......................................................................... 14 4.1 数据通路硬件加速关键技术 ................................................................................................. 14 4.2 UPF引入硬件加速关键技术 ................................................................................................... 16 4.2.1 通用网卡加速技术 ......................................................................................................... 18 4.2.2 智能网卡加速技术 ......................................................................................................... 20 4.3 边缘应用硬件加速关键技术 ................................................................................................. 24 4.4 硬件加速管理编排关键技术 ................................................................................................. 26 5 展望与呼吁 ............................................................................................................. 28 附录:术语、定义和缩略语 ........................................................................................................ 30 中国移动NFV硬件加速技术白皮书 1 1 硬件加速技术概述 1.1 NFV硬件加速产生的背景 硬件加速(Hardware Acceleration)是指将处理工作分配给加速硬件以减轻中央处理器负荷的技术,其利用硬件模块来替代软件算法以充分利用硬件所固有的快速特性(硬件加速通常比软件算法的效率要高),从而实现性能提升、成本优化的目的。 引入硬件加速的计算架构又称为异构计算(Heterogeneous Computing),相对于通用计算(又称同构计算)来说,所谓的异构,就是CPU、SoC、GPU、ASIC、FPGA等各种使用不同类型指令集、不同体系架构的计算单元,组成一个混合的系统,执行计算的特殊方式。 技术的发展如同历史的发展一样,总是螺旋式上升的。NFV通过使用基于X86 CPU或ARM等的COTS硬件以及虚拟化技术来承载网络功能的软件处理,使网络设备功能不再依赖于专用硬件,资源可以充分灵活共享,实现新业务的快速开发和上线,并基于实际业务需求进行自动部署、弹性伸缩、故障隔离和自愈等。然而,随着5G和边缘计算的兴起,面向5G UPF、新兴边缘业务(AR/VR、云游戏、AI)等计算、IO、网络密集型应用时,却发现COTS硬件并不能满足这些应用对大带宽、低时延、高可靠(低抖动,低丢包)的网络要求与并行计算算力的要求。以下聚焦于X86 COTS硬件对加速技术进行讨论。 • X86 CPU为满足通用性,需要支持复杂的逻辑判断,这样会引入大量的分支跳转和中断的处理,使得CPU的内部的控制器和内存的占比较大,计算单元的比重较低。这种架构决定了CPU擅长统领全局的调度、管理、协调等复杂逻辑处理。同时,CPU指令采用取指令、指令译码、内存取 中国移动NFV硬件加速技术白皮书 2 数、指令执行、结果写回一系列串行处理方式,对并行数据处理的效率相对较低; • X86 CPU的性能提升节奏放缓,而新兴业务特性对计算能力的要求超过了“后摩尔定律时代”CPU性能增长的速度,需求与能力之间存在鸿沟。如图1-1所示; 图1-1 应用对计算能力的需求增长速度超过了摩尔定律 • 边缘计算场景中,边缘机房空间小、电力少,非地面机房承重低于核心机房承重能力的1/3,而边缘业务如AI、AR/VR等对算力的需求呈指数型增长,对5G UPF吞吐和时延的要求提高,无法单纯依靠CPU堆叠算力的方式来满足边缘业务的需求。 NFV所采用的通用处理器在特定任务处理上的性能或成本方面存在不足,使得通用处理器配备FPGA、GPU等协处理器(加速卡)的硬件加速方案出现在NFV架构中,可以说电信网络经历了从专用硬件到通用COTS硬件再到通用COTS硬件+加速硬件的螺旋式发展历程。 中国移动NFV硬件加速技术白皮书 3 1.2 硬件加速技术在产业的应用 当前应用和网络对性能加速的需求强烈,公有云售卖加速能力、私有云加速内部网络、设备厂商提升设备能力,均采用了硬件加速;芯片厂商也在广泛布局加速硬件。 微软的Azure catapult项目历经三代FPGA架构,除提供网络和存储虚拟化加速,还可用于加速Bing搜索、深度神经网络(DNN)等计算任务。Azure利用FPGA解决网络和存储虚拟化带来的开销,使虚拟机网络性能由25G达到接近40G线速,数据中心内虚机通信网络延迟降低10倍,多余FPGA资源还用于Bing搜索和神经网络加速。在Bing搜索业务中,采用FPGA加速使系统性能提升两倍,服务器数量投入减少一半。在MICRO'16会议上,微软提出了Hardware as a Service(HaaS)的概念,即把硬件作为一种可调度的云服务,使得 FPGA 服务的集中调度、管理和大规模部署成为可能。 图1-2 Azure的FPGA架构 亚马逊AWS云早在16年就推出了配备FPGA硬件的EC2计算实例F1,用户可编程,为应用程序创建自定义硬件加速能力。自此,公有云服务厂商开始纷纷部署FPGA云加速业务,形成了FPGA结合云计算的FPGA-as-a-service计算平台。 当前,主流公有云厂家均部署了GPU、FPGA计算实例为用户提供服务。如阿里云的异构计算加速引擎,涵盖了GPU、FPGA在内的多款异构计算实例,可 中