从400G到800G:一次飞跃,而非过渡尽管400G以太网(以下简称400G)仍在努力进入生产网络:但市场对更高速度的需求已经浮现。事实证明,私营企业网络对数据的需求永无止境,而众多数据中心也已经开始牵头开展800G的初期部署。无论是疫情的影响,下一代应用的推广,还是员工队伍越来越高的分布程度,都成为这些趋势背后推波助的力量。网络传输的逐代演进一直都是一个规划严谨的过程,似乎与市场中的这些趋势毫无相干。但这些趋势并没有等待业界的共识或标准的出台。惟一具有重要意义的时间线就是,运营商和网络厂商多快能将支持此类技术的正确基础设施推向市场。如果要用某种特征来定义思博伦最近与客户开展的合作,那肯定就是比预期更敏捷的对800G的追求。800G方面的活动最初始于北美和欧洲,而现在也开始在亚太地区逐步加速。这是一项全球性的运动,而且它看起来绝不是一次简单的过渡,更像是一次飞跃。通向800G之路:技术挑战与测试战略 ?关键结论迈向800G的全球运动已经开启,而运营商和网络厂商也在为满足新的数据需求而调整自己的定位。 在仿真超大规模数据中心流量的测试链路上,思博伦已经帮助客户验证了800G光模块的互操作性。我们还通过对真实网络流量的仿真验证了800G光收发机的性能,为数据中心中各类在线应用和服务的持续扩展提供了支持。我们正在与伙伴合作,推进对厂商中立的800G测试解决方案。这项突破性的工作已经展示了下一代高速以太网设备的可行性,以及为初期需求提供支持的准备情况。800G测试的时间线正变得越来越清晰。关键结论随着测试时间线的日渐明晰,思博伦在验证800G设备是否为满足初期市场需求做好了准备。 需求迫切的市场正在浮现800G生态体系将提供更快的能力,在空间有限的现有物理位置中实现容量的最大化,因此一些早期的采用方已经开始要求思博伦对其高密度设备和系统开展验证。具体而言,思博伦需要满足客户对厂商中立互操作性测试的急迫需求,为800G的快速进展和推广提供支持。驱动800G以太网的测试需求的因素包括::物联网(IoT)、数字现实、人工智能(AI)和机器学习等新应用、SaaS应用的持续推广,以及在家办公产生的流量,都为数据中心带来了前所未有的工作负载。快速存取可以为CPU和内存资源的分散配置提供所需的性能。有必要验证能耗更高的各类应用,以及对数据中心内可部署的服务器数量的影响。·运营商在高传输需求地区开展的推广活动。通向800G之路:技术挑战与测试战略 800G测试的时间线逐步成形在整个生态体系中,测试需求和用例都是千差万别的,但它们对于800G的成败均具有至关重要的意义。与其它新技术一样,800G的测试也需要分阶段推出,在较低层取得成功后逐步向更高的协议栈迁移。在这一早期阶段,当我们使用单一解决方案对设备和软件进行测试并确定其质量特性时,800G的成本和效率优势已经显现。生态体系中利益相关方提出的各类不同的要求正在定义该技术的测试需求。光模块和线缆厂商是该技术最早的适配器,其关注的核心是物理层,而初期关注的焦点主要集中于误码率方面。设计和制造交换机芯片的半导体企业将侧重于加快开发和制造进程,使复杂的新型芯片能够以尽可能快的和高的成本效益迅速进入市场。通过不断的芯片生产前验证仿真测图1生态体系测试需求网络厂商芯片厂商光块/网络设备测试效率,线缆厂商制造商加快交付。互操作性和验证设备在满足客户的要求。压力下的性能。通向800G之路:技术挑战与测试战略 试,以及芯片生产后验证测试,将使复杂芯片的设计工作驶入快车道,并且实现更好、质量更高的结果。待芯片更广泛的上市后,网络设备制造商(NEM)和超大规模运营商将首先侧重于启动稳定的链路,然后才会关注应用性能,以及真实的IP和更高层协议流量对性能产生的影响。这一过程包含对厂商提供的连接器和芯片开展验证,以及执行质量保障应用测试。在此类测试开展的同时,零散的标准开发过程和时间线造成的复杂性和困惑,将会成为这一阶段重点关键的关键挑战。各利益相关方没时间去等待这些挑战被逐个梳理清楚,必须从现在就开始采取行动。要想充分信心地开展这项工作,我们必须比以往任何演进更早地执行更全面的测试。了解什么可能出错以及何时出错是制定早期成功战略的第一步。服务商超大规模测试厂商一致性运营商和系统互操作性。验证设备井仿真真实世界的流量。 800G的技术挑战将推动新的测试要求尽管800G是在400G技术的基础上定义而来的,但在所有层均会带来巨大的全新技术挑战。从芯片和光模块/线缆厂商到网络设备制造商,再到超大规模运营商,这些挑战的影响将波及整个生态体系。在协议测试、软件和规模方面,未来将会出现一系列的问题。思博伦已经在这些领域中取得了一些进展,并且查明了若干必须立即加以解决的优先“第一天”挑战。这些挑战正在对必须执行的测试和为其提供支持的能力产生实质性的影响。这些挑战涉及互操作性、物理层性能,以及启动系统所需的各种努力。800G的早期采用方将面临众多的挑战:1不断演进的标准会对该生态体系产生影响。800GPCS的标准和400GFEC对800G的适配将会继续演进,既有小的修改,也有一些巨大的飞跃。虽然使用100G通道实现的800G实施需要依赖来自前几代的PAM4信号编码,但这些推广需要考虑到PAM4速率翻倍的问题,即从50Gbps提高至100GbpS。未来的战略预计可以通过四个200G通道来实现800G,而无需使用八个100G通道。这将是一项重大的变化,而且可能最终会引入更多的技术挑战。在从NRZ向PAM4调制迁移的过程中,发现了许多问题。在这些问题中,有些是较低层级的问题。例如,如果GraV编码被禁用,可以通过检查按通道的PCS统计数据来发现这一现象。在迁移到200G通道的更高量级调制后,我们还需要再次对类似的问题进行调查。我们也需要对真实世界中厂商设备之间的互操作性进行验证,尤其是在这些新定义的领域中。通向800G之路:技术挑战与测试战略 800G以太网标准的演进IEEEP802.3CK定义了100Gbps物理层通道日以太网技术联盟标准增强了MAC并设计了使用100Gbps通道的800GPCS/FECIEEE超400G研究小组确定了即将800G/1.6T定义的目标IEEE任务组目标1目标2目标3.. 设备在多种线缆上建立连接变得更加容易,同时还可以减少手动调节发送设置的需求。在缺少AN/LT时,链路无法建立或链路翻动发生的情况有可能会增加。当链路震荡频繁发生时,吞吐量可能会受到巨大的影响。随着光技术的成熟,链路震荡的情况已经非常罕见,而且通常是由线缆损坏、配置错误或存在缺陷的连接器造成的。而在800G等新技术中,链路震荡也可能是由发热问题、收发机的设计,或交换机本身的问题造成的。“自以太网面世并成为全球网络通信的基础以来,测试一直都是该技术生态体系的关键方面,而且测试在加快未来更高速度以太网的推广方面将继续扮演至关重要的角色。-以太网联盟主席PeterJones 早期的设备将不支持完整的标准。早期的设备可能不会支持电气信号传输的自动协商(AN)和链路训练(LT)要求。根据所用的ASIC,有些设备可能只支持LT,而其它设备可能会同时支持AN和LT。此外,只支持LT的ASIC可能不会兼容支同时支持AN和LT的ASIC,因此在这些案例中,AN和LT都需要禁用,而且链路需要通过手动方式调节。由于LT使光模块可以调节链路互联对端的发送设置,因此解决AN/LT的兼容性问题至关重要。这种能力令使用多种推进800G部署工作通向800G之路:技术挑战与测试战略 白皮书3光器件的调试代价高昂且供不应求。光器件目前处于供不应求的状态,而且价格可能达到数万美元,因此测试的代价也相当高昂。此外,由于能耗水平和发热水平非常高,多种潜在的光器件问题也可能在800G中出现。如果无法实现高效的散热,就很可能导致不稳定的性能。光器件与线缆之间的双向信号通信都需要接受测试。此外,光信道和电气主机接口上的互操作性也需要得到验证。测试系统需要向其接受的光器件发送信号,而光器件也需要向测试系统回送可接受的信号。光器件还需要提供调试访问方式,在加快问题根源的确定的同时,尽可能减少问题发生时的相互推诱。④两倍的速度意味着更大的挑战。追求速度是要付出代价的。从400G向800G的巨大飞跃会带来速度的更大提升和更高的频率(即>50GHz的频谱内容)。频谱的倍增也会导致采样速度和码率的翻倍。因此,在过去可能不会产生任何影响的小问题,在800G上却可能严重损害电气性能。这就相当于过去用惯了80倍显微镜,如今却要使用500倍的产品。在此类高速率下保持高保真度需要更强的ASIC设计,例如需要使用稀有材料和采用公差严格的线路板制程高速带来的挑战将涵盖线路板设计问题和其中的布线。由于采用了更快的光器件和更强大的ASIC,过多的热量也是需要担忧的问题。甚至连针脚的间隔也会成为一项问题。此外,接头和模块之间的任何阻抗不连续性都可能导致电气反射,给保真度和性能带来消极的后果,通向800G之路:技术挑战与测试战略 要想避免功率波动和需要重新设计和重新制造的线路板缺陷,对光器件、ASIC和布线通道执行压力测试已经成为一种至关重要的作法。此外,每当有新设备连接时,如果工程团队都能按照标准惯例的方式参与进来,则正确的互操作性便可得到保障。最后,通过优化各种参数,实现对发射机和接收机特性等内容的完全控制,也可以为成功铺平道路。5精确验证物理层健康的必要性。PAM4链路本身就容易出现错误,因此前向纠错(FEC)是强制性的。但允许超过15个符号的错误可能会导致无法修正的错误代码字(CodeWord),并引发顿校验序列(FCS)错误和顿丢失。对FEC统计数据的分析正逐渐成为评估物理层健康的最有价值的工具。它可以提供性能的更细粒度视图,并预测FCS错误。因此,饱和接收机之类的链路健康问题都可以提前被探测到,而且无需占用数天或数周的时间去等待实际FCS错误的发生。在我们能够以受控方式执行FEC错误注入之前,FEC统计数据可以帮助我们确立强健的电气连接基准, 聚焦关键的800G用例活动可以帮助我们理解800G能力和独特挑战,以及测试在技术和相关市场的进步中所发挥的作用:光模块/线缆厂商用例:在标准尚未完全定稿或仍处于开放解释阶段的环境下,为800G的互操作性提供保障。测试策略:利用IEEE802.3ckQSFPDD应用实现稳定的800G连接并验证线速率流量传输情况。开发和启动800G链路,仿真超大规模数据中心的流量。评估简单的Pre-FEC和Post-FEC错误率,并确保它们符合规格的要求。查明健康和不健康的链路。通过在流量流中注入错误来执行压力测试。确认第2层组顿、前向纠错和码率。创建一个可以连续测试和验证性能的环境。芯片制造商用例:芯片生产前验证和生产后验证最佳方法。测试策略:芯片生产前,提供EDA仿真和基于软件的流量仿真。通过测试场景库实现测试工作流程的自动化和加速。在第1层执行仿真,实现生产前的缺陷实时捕捉,并缩短重新设计和重新制造的周期。执行芯片生产后测试,对已制造的芯片加以验证。 超大规模运营商用例:实施验证,以及数据中心之间或内部的网络和应用性能验证。测试策略:验证网络是否能够保持正常运行,以及应用性能是否能够保持高质量。验证所有层,并确定厂商设备的质量。利用测试KPI和嵌入式专业能力实现直接测试。评估散热和电源状况。连续测试和验证网络与应用的性能。网络设备制造商用例:为现实网络条件下的链路和应用性能提供保障。测试策略启动稳定的链路并验证应用的性能。通过测试来确保设备能够在压力下稳定运行。评估和监视发热和功率问题。在真实条件下对设备施加考验。连续测试和验证网络与应用的性能。实现必不可少的灵活性,满足特定深入用例测试需求,并根据不断变化的需求持续演进。 定义成功的测试战略800G正在快速奔向更快的部署,满足客户对更高连接速率和需求。物联网、人工智能和5G应用的成败都取决于业界更高效验证和部署800G的能力。要想迅速满足各方对更高网络容量日益增长的需求,这才是唯一的道路。虽然整个