您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中国信通院]:大模型刘昭炜:时代下DevOps 加速迈向平台工程的最新思考和研究成果分享 - 发现报告

大模型刘昭炜:时代下DevOps 加速迈向平台工程的最新思考和研究成果分享

2024-11-04 刘昭炜 中国信通院 一切如初
报告封面

姓名:刘昭炜 个人简介 刘 昭 炜 中 国 信 通 院 云 大 所 高 级 业 务 主 管 编写《研发运营一体化(DevOps)能力成熟度模型》系列标准、《研发运营一体化(DevOps)通用效能度量模型》、《业务研发运营一体化(BizDevOps)模型》等标准。参与多篇白皮书、调查报告等编制工作,包括《中国DevOps现状调查报告(2021、2022、2023)》等。参与评估DevOps能力成熟度评估超过20个项目,具有丰富的标准编制、产业研究及评估测 平台工程背景及概念 平台工程落地实践 目录 平台工程能力要求的标准化 需求管理精益化演进的趋势 平台工程背景及概念 多元化研发运营(XOps)体系发展 企业DevOps发展整体向好,但存在一定发展瓶颈 PaaS难以应对多种情况,只能提供一条路径 企业向DevOps全面级迈进,更加自动化、规范化,但平台化能力有待加强 用户认知负担阻碍DevOps进一步实施 根据调查显示,DevOps落地成熟度处于全面级的企业最多,为41.20%,同比增长0.34%,具备自动化、规范化的特点;17.83%企业的实践成熟度处于优秀级,具备平台化、自服务化与度量驱动改进的特点;0.85%的企业处于卓越级,能够实现DevOps的高度智能化、数据化及社会化的特点。 目前,DevOps发展迅速,受到广大组织的积极响应。但是,在DevOps理念的落地实施中,研发人员发现自己需要负责一些原来没接触过的工作。 PaaS,又称平台即服务,是指将软件研发平台作为一种服务提供给用户。PaaS要求云提供商提供开发工具、基础架构、操作系统等构建应用程序所需的一切。 基础设施管理:如管理Docker文件、Helm图表、Terraform代码等文件 流程设计:随着项目人员的变动,可能需要对现有工作流程进行调整。 目前PaaS市场发展比较成熟,存在着各种工具,如SAP云,Azure,AWS Lambda等。大多数PaaS平台为开发人员提供了构建应用程序的环境,但只能提供一条路径,只能通过简单设置支持相对不那么复杂的用例。在企业规模扩张时,开发者人数增加,现有的PaaS解决方案难以满足不同需求。 所有权管理:包括对第三方工具与产品进行管理等工作。 认知负担有可能会引起研发人员的不满,导致DevOps的实践工作受到阻碍。 数据来源:中国信息通信研究院,2023年 平台工程是企业实现DevOps实践的关键推动因素 开发(Dev)与运营(Ops)之间的协作融合 DevOps转型(方法论) 建立和维护综合平台,促进软件高效高质交付 平台工程(工具赋能) 平台工程特征 DevOps目标 •工具、流程和环境的标准化•资源共享和自动化,避免重复工作•集中管理•鼓励协作与最佳实践分享•工具统一,团队可以更关注应用程序开发 •避免团队间差异•提升效率,缩短软件开发生命周期•节约管理成本•提升团队之间协作,打破隔阂•避免花费时间在工具管理上 平台工程团队构建基础设施、技术栈和团队所需的基本基 DevOps团队制定流程和想法,使建设的工具得到最佳利用,充分利用开发周期 础,实现工作流程自动化、确保系统可靠性,提供必要的工具和环境 大模型应用发展取得显著突破 随着人工智能技术的飞速发展,大模型在自然语言处理、计算机视觉、语音识别等多个领域取得了显著的突破。特别是在自然语言处理领域,预训练大模型如BERT、GPT系列等已经成为研究和产业应用的标配。 2023年政策助推大模型在各行业应用快速落地 近年来国内外大模型技术发展迅猛 Ø2023年7月,国家互联网信息办公室等七部门联合发布了《生成式人工智能服务管理暂行办法》: 鼓励生成式人工智能技术在各行业、各领域的创新应用,探索优化应用场景,构建应用生态体系。 Ø2023年12月,国家数据局发布《“数据要素x”三年行动计划(征求意见稿)》: 提出以科学数据支持大模型开发,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。 Ø北京、上海、深圳、安徽、四川等省市出台大模型产业发展措施: 《上海市推动人工智能大模型创新发展若干措施》等政策,加速大模型应用落地,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。 平台工程是为智能化的未来做好准备的前置条件 大模型让数字时代发展的智能化趋势比预想更快。 赋能软件研发运营提质增效 大模型是指具有大规模参数和复杂计算结构的机器学习模型。研运大模型是专门针对软件研发、测试、运维领域的大型预训练模型。基于开源大语言模型,通过私域研发运营数据定制化训练形成,以私有化方式部署为主,用于辅助软件生命周期中的各个阶段。 p研运大模型的应用前景广泛,可以应用于代码生成、自动化测试、日志分析、故障诊断、性能优化等多个方面,显著提升软件研发和运维的效率和质量。 人工智能的核心是工程化,大模型需要与平台工程相融合,才能做到对企业业务有精准理解,从而真正赋能企业的研发效能、质量提升,助力企业迈向智能化时代。 平台工程的概念受到广泛关注 国家层面:多项政策文件均提及或鼓励企业建设内部开发运维平台 p平台工程是一组用于设计、构建和运营支持软件价值交付和生命周期管理的平台的方法、流程和机制,具备自助式、自服务能力,能够最小化内部IT人员的认知负荷,提升DevOps/BizDevOps质量、效率与效能。p当前,在我国加速数字化转型的浪潮下,平台工程对于加强科技能力至关重要,多项政策文件均提及或鼓励企业建设内部开发运维平台。 中国证券业协会:建设统一的源代码管理工具和标准化的研发运维一体化工具平台 国家金融监管总局:积极引入研发运维一体化工具,完善数字化交付管理体系 p《证券公司网络和信息安全三年提升计划(2023-2025)》提到,建设统一的源代码管理工具和标准化的研发运维一体化工具平台,进而将安全控制手段嵌入信息系统开发的需求分析、设计、编码、测试、发布和运维等各环节中,有助于持续提升代码开发效率及安全。 p《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》要求“推动科技管理敏捷转型。建立能够快速响应需求的敏捷研发运维体系,积极引入研发运维一体化工具,建设企业级一站式研发协同平台。建立适应‘敏态’与‘稳态’的全周期线上交付管理流程,完善数字化交付管理体系”。 Gatner将平台工程列为2024年顶级战略技术趋势之一,已经连续两年将平台工程作为关键技术预测。根据Gatner的预测,到2026年,80%的软件工程组织将拥有平台工程团队,来提供内部服务、组件和应用程序交付工具,作为可重复使用的资源。其对“平台工程”的定义为:一套用来构建和运营支持软件交付和生命周期管理的自助式内部开发者平台的机制和架构。 国际权威咨询机构预测 平台工程正在成为助力企业数字化转型的重要推力 平台工程是企业级DevOps成功实施的核心能力 2023年2月,Puppet发布“2023DevOps现状报告“,重点关注平台工程,并将其定义为:是一套设计和构建自服务功能的规程,以最小化开发人员的认知负荷,并支持快速流软件交付。报告指出,平台工程可以为整个组织带来意义深远的好处,帮助企业级DevOps实施走向成功。在公司加强平台团队招聘的过程中,他们必须优先考虑产品管理技能,而不仅仅是核心工程。 >>报告显示,超过4成受访者所在组织具有平台团队的时间超过3年。 >>超过九成的受访者认为,平台工程能够帮助组织更好地认识到DevOps的益处。 平台工程社区蓬勃发展 平台工程相关社区自2021年起快速建立并蓬勃发展,越来越多的IT领导、技术人员开始关注平台工程这一概念。 简化开发运维人员操作,提升体验 平台工程建设目标 平台工程建设要素 提升交付效率 为应用开发提供稳定可靠基础 优化成本结构 平台工程落地实践 精益研发的实现:DevOps 精益研发是全面优化企业运营和提升竞争力的思维方式。它强调通过消除浪费、提高效率和持续改进来推动企业不断向前发展。在精益研发的实践中,战略目的、管理目的和开发目的构成了其三大核心目标。 中国信通院组织编制的DevOps调查报告显示,大量企业通过落地DevOps极大地改善了研发效率和质量管理提升,这与精益研发的嵌入质量和尽快发布等原则高度匹配 多数企业通过成功落地DevOps在以下几个方面获得提升:按时交付、研发和交付效率、客户/用户满意度、研发过程质量。 国内企业DevOps落地成熟度稳步提升,约六成企业达到DevOps成熟度全面级及以上。 基于精益价值流实现平台工程 平台工程能力建设全面助力企业数字化转型提质增效-以某保险企业为例 将平台工程视为“平台产品化建设+DevOps+PaaS+基础设施”几大能力的集合,构建以用户服务为中心的平台工程分层能力,包含自定义能力、模板化能力、扩展能力、抽象能力等核心产品特性。 通过整合业务、产品、研发、运维等角色端到端的协作过程,助力公司打造出提升研发效能的一站式研发协作平台,成为支撑公司四大业务生态快速发展的技术基石。 平台工程能力建设全面助力企业数字化转型提质增效-以某证券企业为例 Ø关键痛点:1.各研发团队重复建设,公共能力无法得到有效管理持续 运营;2.相对独立的工具也导致各平台数据孤立存在,难以实现整体研发流程的贯通及数据的流转;3.研发过程专业化工具不足,成为研发效率提升瓶颈,对研发过程风险管理也带来了很大挑战。Ø平台工程建设举措: 1.研发人员赋能,为上层应用提供最佳工具和实践; 2.孵化并组建平台工程团队,负责平台的规划及构建、维护和持续改进;3.通过编排技术实现工具之间的无缝集成和自动化管理,实现跨部门多阶段协同;4.建设专业领域技术人员和平台工程师之间的协作文化,打磨形成平台思想的文化理念。Ø平台工程建设效果: 打造建设了民犀研发管理一站式平台,极大促进了项目协同效率,同时通过平台实践研发数字化转型、研发智能化转型,在提升研发效率效能的同时有效降低风险。 平台工程能力建设全面助力企业数字化转型提质增效-以某电信企业省分公司为例实践路径 路径一:强化平台能力 效果提升 p强化AI引擎和大数据共享服务能力。以“共享化、智能化、敏捷化、微服务化”为标准,加快推进5个能力中心、2个平台改造,攻坚12项关键任务。 p优化方案输出时间节省50%,优化区域大包业务下载速率提升8.9%,扩容区域流量激发30%以上。 p巡检效率提升6倍,异常检测识别准确率95%以上,故障定位时长减少75%。 路径二:打造“五极”智慧能力 p基于BizDevops+ AIOps模式,部署60多个重点应用,将500个编排原子能力、100多个AI能力融入无线网、核心网、网络云等专业核心运维生产流程,持续提升网络运维“五极”智慧能力,赋能网络提质增效降本。 路径三:推广业务研运体系 p线上打造AN线上孵化工场、原子能力中心、开发者中心开展网络研运维一体化,实现对68个AN重点项目全生命周期管理。 平台工程能力要求的标准化 以产品思维运维平台 平台工程的内容不止包含对平台的设计和建设,还需要贯彻落实“平台即产品”思想,收集用户反馈,对平台不断进行运营优化。 平台团队 平台团队:领导平台的设计、实现和维护 平台团队负责人:对团队进行管理,保证团队内外具有良好的沟通协作能力,确保团队人员的技能符合要求。 推广团队:主要负责与企业各项目负责人沟通,敦促其在开发过程中使用平台。 排、Kubernetes、接口设计与管理、运营团队:主要负责收集处理用户需求、度量平台指标(平台覆盖度、建筑覆盖度、团队健康度、服务健康度、社区参与度)、接收用户反馈,对平台持续进行优化。 赋能团队:主要负责平台功能的实现,由各领域的专家组成。需要的能力有:敏捷开发、容器编软件工程、持续集成/交付、APIGitOps工具等 《研发运营一体化(DevOps)能力成熟度模型第1