JiNOS技术白皮书 中兴通讯版权所有未经许可不得扩散 JiNOS技术白皮书 JiNOS技术白皮书 版本 日期 作者 备注 V1.0 2025/04/16 中兴通讯JiNOS项目组 第一版 ©2025ZTECorporation.Allrightsreserved. 2025版权所有中兴通讯股份有限公司保留所有权利版权声明: 本文档著作权由中兴通讯股份有限公司享有。文中涉及中兴通讯股份有限公司的专有信息,未经中兴通讯股份有限公司书面许可,任何单位和个人不得使用和泄漏该文档以及该文档包含的任何图片、表格、数据及其他信息。 本文档中的信息随着中兴通讯股份有限公司产品和技术的进步将不断更新,中兴通讯股份有限公司不再通知此类信息的更新。 目录 1.引言1 2.JiNOS体系架构2 2.1以数据为中心架构3 2.2云原生架构5 2.3AI内生架构6 3.JiNOS的优势7 3.1ISCU7 3.2动态多实例8 3.3虚实统一部署9 3.4YANG模型自动适配10 3.5内生智能12 3.6丰富的功能特性12 4.总结和展望13 1.引言 在当今数字化时代,网络技术正以前所未有的速度发展,深刻改变着人类社会的生产生活方式。5G-A&6G、智算、AI等新兴网络技术的崛起,不仅加速了全社会数字化转型,同时也对网络本身提出了全新的挑战。 下一代网络操作系统需具备以下特征: 高性能与可扩展-无论是面向6G的“千亿物联”,“无缝万兆”,还是业务云化时代,网络应用短时间迅速传播,网络必须能够可扩展并提供高性能。 弹性与可靠性-网络中断的影响层层递进,从连接丧失到网络可用性下降。故障事件 可能源自网络的任何方面——硬件、收发器、线缆、软件等。故障检测、隔离、恢复和弹性是关键功能,网络操作系统必须提供必要的弹性,并能绕过这些故障。 可编程性和自动化-NetDevOps的核心在于持续集成/持续交付(CI/CD),要求 NOS具有深度的可编程性接口,以便与应用程序通过开放API紧密集成,应用监控、流量工程和动态资源优化都需要NOS具备可编程能力。自动化有助于业务部署,实施按需安全策略,实现更快平均修复时间(MTTR)的时间。 AI内生-AI技术快速发展,通过AI算法优化网络性能、增强故障预测与自愈能力, 实现自动化运维,降低人工干预,提高效率与可靠性,满足未来智能网络需求。 JiNOS是中兴通讯推出的新一代网络操作系统,专为应对云时代网络挑战而设计。它作为中兴通讯网络设备的软件核心,为路由器、交换机、OLT、OTN等产品提供强大的软件支持,助力构建智能、极简、超宽、安全和开放的网络。 2.JiNOS体系架构 JiNOS针对运营商网络、超大规模数据中心、大型园区等场景进行了优化。它融合了现代软件和操作系统理念,以数据为中心,集成AI能力,构建在云原生平台基础上,能够支持部署在传统框式、盒式以及云化设备上。 JiNOS总体架构由四个平面组成。 控制平面:运行路由、MPLS、链路层、安全等各种信令和控制协议,生成各种转发表项以控制数据面的转发行为。JiNOS的控制平面主要可以分为Layer2、Layer3、DC、MPLS、SR、SRv6、VPN等业务。 管理平面:对外提供设备的管理接口,如CLI、Telnet、SSH、SNMP、HTTP、Netconf、Restful和gRPC等。通过管理平面,实现对JiNOS进行设置、监控、管理。 智能面:JiNOS引入AI技术,以提升网络设备的智能化水平。智能面的内生AI引擎和AI应用;辅助设备故障定位、隐患识别、设备节能和AI防攻击等。 数据面:提供数据报文转发功能,包括本地报文的收发,基于各层转发表的数据转发功能等。 2.1以数据为中心架构 JiNOS的核心创新在于其以数据为中心架构,传统NOS大多是以消息为中心的系统,各个组件进程之间通过消息的收发完成协作和流程处理。该模式围绕业务处理流程,依次定义各个组件之间的交互,并围绕交互来设计系统。 以数据为中心的架构核心是面向数据的架构,数据模型和数据库成为了灵魂和核心,应用从关注消息流程,转变为关注数据,围绕数据的变化来进行相应的处理。这一架构通过将状态信息与进程本身分离,实现了系统的高效运行和灵活管理。 这种设计使得JiNOS能够在进程级别实现快速收敛、故障恢复和实时软件更新,而不 会对系统整体的运行状态造成影响。 在JiNOS中引入了全新的SDDM分布式高性能数据库,SDDM专为数据驱动设计范式提供支持,提供具备卓越的数据访问速度;同时支持可靠的变更通知机制,实现业务组件间的解耦;还具备主备分布式事务处理能力,在业务不感知的情况下,支持严格的主备同步和无损重生能力。 高性能:基于零拷贝技术和平滑扩缩容Hash,实现超高性能的数据访问能力(单核200万QPS的访问性能)。 高可靠:通过基于消息的事务同步技术,提供业务无感知的主备NSR保护和本地无损重生能力,保证业务在主备倒换和进程重启后的完全无损恢复。 轻量易用:采用C语言开发,无中心瓶颈点,具备性能无限水平扩展能力 开放易运维:提供统一的维测接口,支持数据变更实时观察和统一查询,支持通过Telemetry等通道实时上报所有业务状态,支撑数字孪生等下一代的AI应用。 JiNOS的内存数据库是其以数据为中心架构的重要组成部分,这个内存数据库在运行时由机器生成,包含了系统的完整状态信息。 内存数据库的状态信息采用发布/订阅机制。每个JiNOS进程都会订阅这个状态信息库,以便在其他进程的状态发生变化时接收通知。状态变化的通知被缓冲并异步发送到状态信息库,然后状态信息库会通知所有已订阅变化状态的其他进程。 这种发布-订阅架构是一种高效率的模型,确保了低开销,并在出现故障时提供弹性。 2.2云原生架构 JiNOS采用了容器化架构,为JiNOS以及第三方应用提供独立的运行环境,极大地提升了系统的灵活性和可扩展性。 JiNOS的基本功能运行在容器中,这种设计使得系统模块化程度更高,便于功能的分割和管理。通过将核心功能封装在容器中,JiNOS能够实现快速部署、升级和回滚,同时减少了不同功能模块之间的相互干扰,提高了系统的稳定性和可靠性。 JiNOS本身支持基于容器的发布形式,即以容器镜像的形式发布虚拟化产品。这种方式与业界广泛使用的K8S等容器管理工具无缝集成,使得JiNOS能够通过K8S进行高效的管理和调度。用户可以通过独立的容器运行JiNOS的基本功能,并根据实际需求动态增 加容器来运行扩展功能。这种灵活的架构设计不仅满足了不同场景下的功能需求,还降低了系统的资源占用和运维复杂度。 在JiNOS的设备上,还支持通过容器部署第三方软件。无论是JiNOS自身的容器还是用户创建的容器,都运行在Linux内核之上,直接使用物理设备的硬件资源。这种设计不仅提高了资源利用率,还通过容器技术实现了容器间的隔离和资源分配控制,确保了不同应用之间的安全性和性能稳定性。 2.3AI内生架构 将AI技术集成到网络设备中,是网络技术发展的重要趋势,它能够显著提升设备的智能化运维能力,增强设备的安全性,同时促进网络创新,为用户提供更加个性化的体验。通过AI技术的深度融入,网络设备可以从传统的被动响应模式转变为主动感知和预测模式,从而实现更高效的资源管理、更精准的安全防护以及更快速的故障诊断与恢复。 如JiNOS整体架构图所示,JiNOS的AI内生核心组件包括三个关键部分:知识库、推理引擎和AI应用。 知识库:AI内生架构的基础,它存储了网络拓扑、设备信息、流量模式、安全威胁等 时序数据。知识库的动态更新机制确保了数据的时效性和准确性,为后续的AI推理和应用提供了可靠的数据基础。 推理引擎:AI内生架构的核心,它基于机器学习、深度学习等先进算法,对知识库中 的数据进行深度分析和学习。通过实时感知网络状态并进行预测,推理引擎能够提前发现潜在的网络问题或安全威胁,从而为网络优化和安全防护提供科学依据。 AI应用:AI内生架构的价值体现,它利用推理引擎的输出结果,实现了一系列智能化 功能,实现网络优化、安全防护、故障诊断等智能化功能。 3.JiNOS的优势 3.1ISCU 传统网络设备的可靠性,依赖于设备软件系统的主备,比如常见的路由器主备控制面发展出来了ISSU(In-ServiceSoftwareUpgrade)和NSR(Non-StopRouting)等可靠性技术。ISSU和NSR依赖于设备的主备控制面协同才能实现软件在线升级时不中断转发。这种机制的软件升级过程复杂,升级周期长;同时对在网的大量单主控设备,比如数据中心网络中大量的盒式单主控交换机,目前的可靠性机制不适用。 ISCU(In-ServiceComponentUpgrade)的实现来源于JiNOS以数据为中心状态外置的架构。组件的状态信息都存储在内存动态数据库中,组件版本升级,新版本的组件启动后,读取内存状态数据信息,完成组件的无损重生,这个过程转发面不感知,同时保持网络的稳定。 ISCU在机架式设备上的优势:缩短软件升级时间和降低升级风险,现有的机架式设备ISSU需要先在备主控上升级软件版本,执行主备切换,再原来主控上升级软件,同时所有组件都需要重新初始化,执行时间一般大于30分钟。ISCU只升级相应组件,组件升级时间减少到分钟级和秒级(不同组件重生时间不一样),同时极大降低网络升级风险。同时, JiNOS的ISCU能力可以帮助用户在网设备在线扩展新特性,比如在运营商网络,存量MPLS网络升级支持SRv6,在数据中心网络在网设备扩展支持智算新特性。ISCU可以帮助用户在线扩展新特性。 ISCU在单主控设备上的优势:数据中心网络大量采用单主控盒式设备,网络可靠性依 赖于网络可靠性技术和设备间的可靠性机制,单设备无法通过主备依次升级来实现ISSU。ISCU技术可以提升单主控设备的可靠性,同时由于降低了设备升级风险,网络设备可以像终端设备一样自主升级版本。网络设备检测到设备版本的更新,可以自主选择升级版本。解决当前网络版本升级周期长代价高的痛点。 3.2动态多实例 网络设备在在网运行周期内,不同的时间段对路由学习、处理和通告的性能要求是不一样的。比如在满配置设备重启时、在网络中发生路由震荡期间、在业务量的增加时,网络设备对协议处理性能要求是变化的。 网络中不同的角色,对路由学习、处理和通告的性能要求也是不一样的。比如,RR对BGP通告性能有极致要求、ASBR对路由学习性能有更高的要求等。 JiNOS设备的动态多实例机制可以充分发挥设备的芯片能力,根据设备运行状态和设备在网络中的角色,有针对性提升设备性能。 模块解耦与实例按需配置:将路由接收、处理、通告过程进行解耦,使路由接收模块、路由处理模块和路由通告模块相互独立,且各模块可按需配置资源(实例数)。 多实例动态扩缩容:监控组件实例的运行状态,各组件按需进行多实例部署,并实现多 实例的动态扩缩容。通过这种方式,可根据实例数线性提升路由学习、路由收敛以及路由通告性能。 3.3虚实统一部署 JiNOS平台通过创新的架构设计,实现了物理网络设备与虚拟化网络功能的深度融合。它不仅可以运行在中兴通讯的物理路由器、交换机等硬件设备上,还能以虚拟化形式部署在云平台或虚拟化环境(vCPE,vBRAS等)中。这种虚实统一的能力使得用户能够根据实际需求灵活选择部署方式,无论是传统网络,还是基于NFV(网络功能虚拟化)的云化网络,JiNOS都能提供一致的功能和体验。此外,JiNOS支持与主流云平台(如OpenStack、Kubernetes等)的深度集成,能够实现虚拟网络功能的自动化部署和管理。通过统一的API接口和管理界面,用户可以轻松管理物理和虚拟网络资源,实现资源的动态调度和优化配置。 支持网络创新:虚实统一部署为网络创新提供了更多可能性。例如,用户可以在虚拟化环