您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [腾讯]:腾讯云CentOS替代白皮书 - 发现报告

腾讯云CentOS替代白皮书

2025-05-12 腾讯 话唠
报告封面

腾讯云CentOS替代白皮书1.为什么要替换CentOSCentOS停服背景CentOS作为一款开源且与RedHatEnterpriseLinux(RHEL)高度兼容的Linux发行版,曾在操作系统市场中占据显著地位。据相关数据统计,在全球范围内,有超35万家公司在使用CentOS,其中营收规模在5000万美元以下的中小型企业的CentOS使用占比达69%。在中国市场,CentOS在服务器操作系统领域同样具有举足轻重的地位,大量企业的业务系统搭建在CentOS之上,涵盖金融、能源、制造等多个重要行业,据统计,2022年CentOS在大多重要行业的部署量超过50%。2020年12月08日,CentOS官方宣布了停止维护CentOS项目,并推出了CentOSStream项目,并表示后续都会投入到CentOSStream项目中。其中,各CentOS版本的停服时间点如下:CentOS6已于2020年11月30日停止维护CentOS7已于2024年06月30日停止维护CentOS8已于2021年12月31日停止维护停服后相关操作系统的上下游关系变化如下图所示: 带来的影响CentOS停止服务主要的影响包括:安全风险加剧漏洞暴露:停服后,官方不再推送安全补丁,系统存在的安全漏洞如高风险的CVE漏洞无法得到修复,这为黑客攻击提供了可乘之机,可能导致数据泄露、系统瘫痪等严重后果,使企业的业务安全得不到有效保障。恶意攻击增加:没有官方的安全更新支持,企业的CentOS系统会成为黑客重点攻击目标,因为黑客知道这些系统存在未修复的漏洞,容易被利用来获取企业敏感信息或破坏业务系统。技术支持缺失问题解决困难:企业在使用CentOS系统过程中遇到技术问题时,无法获得官方的专业技术支持和维护。只能依靠自身技术团队或寻求第三方支持,但这可能会增加技术难度和解决问题的成本,且第三方支持的专业性和及时性也难以保证,影响业务的连续性。技术发展受限:由于CentOS停服,不再有新版本软件包发布,缺乏对新功能、新架构的支持,企业的系统发展会陷入停滞,难以跟上技术发展的步伐,可能影响企业在市场中的竞争力。应用兼容性挑战软件适配问题:随着技术的发展,新的应用程序可能不再支持旧版本的CentOS, 企业需要对应用程序进行升级或重新开发,以使其在新的操作系统上正常运行,这需要投入大量的时间和资源。同时,已停更版本上的应用和驱动程序可能不能在新系统上进行有效衔接和适配,影响应用系统的稳定运行。硬件兼容性问题:如果企业需要更新硬件设备,新硬件可能与停服的CentOS系统存在兼容性问题,导致硬件无法发挥最佳性能或无法正常工作,进而影响企业的业务运营。虽然CentOS社区建议用户切换到CentOSStream,但CentOSStream社区支持相对薄弱,难以快速提供全面解决方案,且红帽对其支持策略存在不确定性,同时滚动更新模式致使系统版本持续变动,企业难以确定固定、可靠版本,备份、恢复与升级操作难度增大,这些现状都意味着CentOSStream并不适合企业的核心关键应用。总的来说,CentOS停止服务后,继续使用CentOS,将给企业的业务运行带来极大的隐患,需要尽快实现CentOS的替换,规避风险。2.替代模式和重要关注点2.1.3种替代模式替换方案的制定,以保障业务系统可靠运行为主,目前业内主要有以下3种替代实施模式:原地替换是目前替换工作中应用最多的一种替换模式,是指通过替换工具,直接将线上运行的CentOS或者其他兼容操作系统(OracleLinux、RHEL)切换成目标操作系统的替换模式, 原地替换 替换过程将进行操作系统的系统软件包的替换,替换后,从内核态到用户态均切换为相对应版本的TencentOSServer。原地替换的优劣势如下:优势:替换过程简单,不需要重新对操作系统进行配置,不需要重新部署应用,实施周期短。劣势:在替换复杂环境的操作系统时,可能会遇到替换失败的情况,替换失败可以通过系统回滚来恢复业务系统正常运行。新增替换新增替换是指在替换资源,例如ARM、C86或者是其他架构芯片的服务器上,全新部署目标操作系统,部署应用程序,完成测试后,进行应用系统割接,替换现有环境。新装替换的优劣势如下:优势:替换后系统运行在“完整”的目标操作系统上,同时,替换过程可以先充分测试验证后再割接到生产,变更时间可控,对业务影响可控。劣势:需要与业务系统变更周期吻合,需要额外的硬件资源投入,对业务系统集群特性有所要求,相对替换周期较长,同时业务系统割接会有割接风险。托管服务托管服务是不对现有的环境进行任何的替换动作,业务仍然保持现有的运行状态,服务供应商针对现有运行环境提供支持服务,例如安全补丁修复、技术支持等。主要适用的场景包括:操作系统版本老旧,替换意义不大,例如CentOS6以及更早的版本业务系统无法提供替换窗口,不适用其他两种替换模式业务层软件对目标操作系统不兼容,或替换后不承诺维保支持 2.2.替代实施阶段为了保障替换过程中的生产可用,替代通常需要包含以下几个项目实施阶段:(1)生产环境调研开展生产环境替换工作之前,需要充分调研应用系统情况,包括具体应用系统名称、版本、集群情况等信息,为后续的替换方案初步制定以及替换项目过程提供依据。(2)替换方案确定针对所收集的生产环境信息,确定每个系统采用的初步替换模式,包括新增替换、原地替换以及托管服务。针对新增替换和原地替换,需要根据实际的生产环境情况,与业务团队共同确定替换的操作方式以及替换过程,同时需要确定替换后的业务验证方法,便于替换后对业务的可用性和正确性进行验证。(3)替换测试为了保证生产系统替换的顺滑,在正式替换前,建议搭建测试环境,对方案中制定的每一种替换模式进行测试,测试的目的一方面是验证替换方案的可用性,另一方面,也让替换团队中各方对替换流程、替换工具的使用等进行熟悉,从而确保正式替换时的可靠性。(4)系统替换根据所制定的替换方案以及替换过程,在生产系统中进行逐步实施,其中原地替换建议通过批量替换平台进行批量实施。(5)替换后验证和跟踪替换完成后,对业务进行可用性和正确性验证,对发生的异常进行快速响应,通常这一步骤需要业务运维团队以及替换实施团队的密切配合。2.3.替代过程中的关注重点存量应用的适配兼容存量应用是在替代项目中最让实施团队烦恼的事情,几乎所有的企业都存在着数十、数百套正在运行的业务系统,这些业务系统很难在进行CentOS替代的时候进行升级、换代,特别 是一些已经上线超过5年的业务软件、平台软件。这时候在替代过程中,降低这些存量应用的适配兼容风险,就是一个需要关注的重点。这其中又包括了:原地替换时存量业务是否能够无缝的兼容新的操作系统平台。当发生跨平台替换的时候,存量业务是否能够平滑的转换到新的架构平台上。替代方案的低风险实施生产环境对于企业的重要性不言而喻,它是企业核心业务运行的基础,直接关系到企业的运营效率、客户满意度和经济效益。从生产环境的重要性维度来看,替代方案的低风险实施是非常必要的,这里面又包括了:替换过程的业务连续性:替换过程应该是能够尽量低的对现有业务运行产生影响,停机窗口越小越好。替换后的系统稳定性:稳定性与操作系统的兼容性、技术能力等都有很大关系,特别是兼容性,这一风险的规避与存量应用的适配兼容有极大的相关性。替换后系统性能:特别是在原地替换项目中,替换后的操作系统应该具有不低于原系统的性能。替换后的运维管理:三分建设,七分运维,大多企业的IT系统都有各种运维技能和运维工具的沉淀,是否能够平滑的接管新的操作系统,也是一个重要的风险点。替代方案的低成本实施在替代项目中,成本也是需要重点考虑的部分,替代成本主要包括软件成本、适配成本、实施成本,其中最重要的也是相对变数较大的就是适配成本和实施成本,而这些成本在项目中通常需要用户自行承担,形成“成本黑洞”。适配成本:这是在替代项目中最重要的组成部分,也是主要的风险点,上层应用软件的兼容性主要和操作系统的核心组件有关,例如glibc、gcc、openssl、jdk等,如果替换后的操作系统能够提供与CentOS完全兼容的版本,将极大程度的降低适配难度和适配成本。而在跨平 台替换中,例如更换为ARM、C86服务器,这是有有些业务系统软件需要重新编译,而完全兼容的核心库也能充分减少编译工作量和遇到的问题。实施成本:替代实施过程是否足够简单,能否由初级工程师来承担,能否尽可能的大批量执行,能否进行预评估从而降低与业务团队的沟通成本,这些都是有效降低实施成本的方法。3.腾讯云CentOS替代实践3.1.腾讯云Linux服务器操作系统腾讯云Linux服务器操作系统V3(TencentOSServerV3)是腾讯云基于Linux内核自主研发设计的服务器Linux操作系统,支持ARM、LoongArch、MIPS、SW64、x86架构的CPU,可运行于龙芯系列,飞腾系列,申威系列,兆芯系列、鲲鹏系列、海光系列等多种不同CPU架构的服务器设备,支持主流的国产数据库和主流的国产中间件等软件,支持国产主流虚拟化/云平台。腾讯云Linux服务器操作系统V3通过了财政部质量测试-《操作系统政府采购需求标准(2023年版)》,通过了安全可靠测评。腾讯云Linux服务器操作系统V3基于5.4内核,用户态与RHEL/CentOS同源兼容,支持现存业务系统的CentOS原地替换,在稳定性、性能、容器基础设施等核心能力方面做了全面的增强和优化,能为企业提供稳定高可用的服务,满足业务严苛负载需求。3.2.与CentOS的用户态二进制兼容TencentOSServer在自研内核的基础上,用户态组件部分保持与CentOS同源并兼容(均源自相同的上游开源软件仓库,重新构建、打包,形成发行版,保持北向软件生态的100%兼容)。原有运行于CentOS环境的应用可以直接运行于TencentOSServer之上,无需额外适配。同时,TencentOSServer还提供了完整的迁移工具套件,可辅助实现CentOS的原地迁移,最大程度降低迁移风险和成本,相关工具套件也已经经过大规模实践和应用。 3.3.替代场景及案例分享3.3.1.某省政务云底座CentOS替代项目项目背景XX省政务云原底座操作系统采用CentOS系统,随着安全要求的提高,在政务云专区需要替换为安全可靠的服务器操作系统,为云平台中提供的PAAS服务,如数据库TDSQL、TBase和TBDS等PAAS服务替代挑战政务云服务需要保持7*24的高可用性,在进行底座操作系统替换的同时,需要保证上层PAAS服务的连续性以及数据的安全性,替换的时间窗口短,替换可靠性要求高。实施方案针对存量业务评估迁移条件,满足迁移条件的进行国产化OS原地替换,不满足迁移条件的系统持续提供维保服务,新增集群节点直接采用TencentOSServer,基于TencentOS和CentOS的用户态兼容,可以使用相同版本的PAAS层组件,从而实现新老节点集群融合项目收益针对客户新扩容集群,使用TencentOS作为底座支撑上层数据库、大数据、容器等业务,保障操作系统层面的软件包与原系统的一致,从而实现了业务快速扩容和改造。针对存量CentOS业务,提供操作系统原地替换工具,完成操作系统国产化替换;对于不 适合替换的业务,持续提供维保支持,协助业务定位和解决多个老旧操作系统可用性问题。3.3.2.某部级单位核心业务系统CentOS原地替代项目项目背景某部级单位,存量CentOS约3000套,运行的业务系统比较复杂,例如软件平台中包括了由于CentOS停服的原因,为了保障系统安全和欣欣安全,需要尽快完成CentOS迁移,规避CentOS停服风险替代挑战应用环境复杂,包括自主软件、还包括大量的开源软件以及传统商业软件核心业务的连续性、稳定性要求高,对替换时间要求苛刻,要求风险规避能力强实施方案使用TOSAM集中原地替换平台实现集中批量替换采用同源兼容TencentOS,保证对现有业务的