您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [开放运维联盟&高效运维社区&DevOps时代]:泰康研发体系及一体化研发平台演进心路历程 - 发现报告

泰康研发体系及一体化研发平台演进心路历程

报告封面

郭鸿DevOps平台团队负责人 个人介绍 郭鸿泰康保险集团DevOps平台团队负责人 历经集团各研发工具、研发流程从0-1的建设、致力于泰康保险集团研发工具体系设计、一体化研发平台规划设计、DevOps运营体系设计及DevOps社区持续运营、赋能培训等;实现DevOps平台在全集团的应用落地并持续优化,最终获得用户高度认可。 泰康保险集团一体化研发平台演进历程 集 团 研 发 体 系 及 工 具 链 建 设 背 景 1 目录 集 团 研 发 体 系&一 体 化 研 发 平 台建 设 实 践 2 CONTENTS 全 集 团 推 广 落 地 实 践 及 效 果 3 思 考 与 展 望 4 01集团研发体系及工具链建设背景 研发体系建设思路缺乏共识、且重管理,轻协同 研发工具缺乏统一规划,重复建设严重,多而散 针对全集团基于研发过程:需求-研发协同-编码-CICD-代码扫描、测试、运维7个阶段的工具使用情况进行全面摸底调研,发现各机构都基于各自业态建设了研发工具,分属不同的职能团队承建,主要以开源产品为主,共涉及30个工具;其中存在同类工具:需求及研发协同:6个;代码管理:5个;构建发布:4个;代码扫描:7个;测试:8个。 研发流程复杂而不畅,自动化程度低,过程数据完整性差 关键研发链路存在9个断点,既定工具上的管理流程和用户的实际操作严重脱节; 用户为了满足流程或者完成必要的全过程作业都需要频繁跨平台操作,且在作业链路上的平台间缺乏自动化的联动,信息流受阻,用户体验较差,无法获取全过程完整数据,且由此获取的数据准确性不高。 研发用户面临多平台选择,跨平台操作,成本高,效率低 多套同类平台且缺乏推荐方案,让用户的选择无所适从,同时对平台的服务、稳定性及可靠性存在担忧,同一角色的完整作业流程需要频繁跨平台操作导致了很多用户的抱怨或者直接弃用,从而出现了一些为了满足管理流程而象征性使用,实际自造轮子的情况。 研发工程支撑的挑战:各专业领域工具打通,支撑全集团场景 研发人员在日常工作中涉及到诸多能力支撑,如需求管理、研发任务管理、CICD流水线、制品管理、自动化测试、运行时通用可观测等,当前需要在各专业领域工具切换使用,一定程度上影响了研发伙伴体验与工作效率。那么打通各专业领域工具,支撑全集团研发场景是研发工程平面临的挑战。 研发工具的学习和使用成本较高,在平台间切换,操作体验繁琐,且存在不匹配,部分功能达不到预期 02集团研发体系&一体化研发平台建设实践 一线用户希望:有统一、稳定的平台,提供标准规范的指导 B子公司研发部我们面向研发用户发布关于研发工具平台诉求的问卷,其中92.3%以上的用户都希望使用包括:研发协同、编码、脚手架、制品管理、CI/CD、微服务管理、应用可观测等能力的一体化研发平台,减少研发人员在工具间的切换成本和工具平台的整体使用成本,聚焦开发工作本身。 同业调研:一体化建设/演进成为主流提效方案 资源规模 个性化程度高 产品化运作 研发能力一体化 趋势洞察 同业研发平台人力投入约为研发团队的3%~8%,较低的数值难以维持一个完善的一体化研发平台且服务好全体科技团队。较高的研发平台投入可以来带良好的规模效应。 重视“用户”体验,从提升DX(DeveloperExperience)的角度出发进行产品的建设与运营,提升研发生产力。 各家公司都在积极推动与研发全生命周期工作的全流程打通,打造“一体化研发平台”是业内主流提效方案 当前,同业大多基于采购的商业化产品+开源能力,搭建符合实际场景的平台。金融行业重视自主可控存在个性化需求,较少全量使用“全家桶”产品。 一体化研发平台建设方案目标:自主可控方案 •综合行业经验萃取和泰康实际研发场景评估,一体化研发平台的建设方案思路:自主可控方案。在现有产品的基础上,引入垂类的开源/商用产品作为核心底座,实事求是按照泰康场景量身定制,建设覆盖研发协同、编码、构建、测试、发布到部署的全流程一体化研发平台。 一体化研发平台建设实现方案(贯穿从研发协同态-运行态) 一体化平台功能架构:全功能覆盖,模板化、自助化、可视化 高效协同:任务管理、代码管理同平台操作 流水线模板全覆盖、可编排、制品可追溯 代码扫描支持规则配置,门禁开关,问题分配,质量有保障 租户资产透明化、度量可视化,促进资源利用率和效率提升 03全集团推广落地实践及效果 社区运营:组建和经营全集团DevOps社区,持续打造DevOps文化 •建立DevOps社区运营机制(800+人用户群+7*24h客服),响应时效<5分钟,反哺平台建设,提升一线用户体验,满意96%+。 •实时关注DevOps专业领域发展趋势,引入专业培训为研发骨干赋能,设计了1套训战结合的云原生培训体系,每年开展内外部培训20+场,按需为子公司提供定制方案,获得用户及相关领导的一致好评。 用户运营:走进一线、服务一线、用户代言 •除了DevOps社区运营之外,定期组织各子公司的专场技术交流、新功能宣导,现场用户调研,定期问卷调研及时获取用户对平台的使用反馈和新场景诉求,从而获得了广大用户的认可,用户满意度高达96%+ •通过社区和用户运营,也逐步建立了用户代言机制,很大程度上减少平台团队的运维和宣传推广成本。 使用总览:用户持续稳定增长,已成为不可或缺的核心平台 平台从建设之初至今始终秉承服务研发一线的目标,新建项目及构建发布次数逐年快速增长,近三年以来,已基本覆盖全集团的研发场景,覆盖率年增长约20%,用户覆盖率70%+,月活用户1500+,月度流水线2万+,流水线日均构建发布6k+次,已成为研发用户不可或缺的核心平台。 平台使用推动应用架构优化,促进提质增效 •通过使用平台自动化构建部署梳理单主机多端口发布应用,两年约减少15%,持续促进应用架构调优,提升业务应用的高可用性; •在平台上实现容器化部署模板,为新应用或者云原生改造的应用提供模板化支持,逐年提升云原生应用数量,资源成本降低约50%; •通过分析挖掘平台生产发布数据,持续提升应用的代码质量和发布成功率,当前生产发布成功率96%+ 平台持续建设及规模化使用促进降本增效 •从1.0-4.0持续建设,覆盖率增长500%,发布效率提升86%+,总发布/生产发布次200+w/40+w次,同类工具持续收敛;•基于集团及各子公司研发业态,研发全链路上各种研发工具整合、收敛、集成,提供了丰富的流水线模板,降低工具使用成本50%+,代码扫描功能持续推进,全集团千行代码重点问题数减少了10%;•平台级Dora指标表现:部署频率(针对应用/服务,部署代码频率)0.83次/天,变更失败率(导致服务降机或事后补救的变更百分比)0-7%,变更前置时间(从代码提交到成功运行到生产环境的时长)8.04h 总结:团结一线,持续提升平台服务,为过程改进提供洞察支撑 04思考与展望 研发工具发展趋势:平台工程化 业内普遍认同在一定规模的研发组织内,关注研发人员体验(Developer Experience,简称DX)是能够显著提升组织研发生产力的重要手段,而“平台工程”理念的引入被认为是改善“DX”的具体举措。 “平台工程化”理念的引入,使得“DX”的提升有了明确的方向 “DX”能够有效提升研发效能 根据gartner于今年4月发布的调研报告,有超过58%的研发团队领导认为,改善开发者的工作体验,是在研发全生命周期中提升效能的最优选择之一。 平台工程指的是一套用来构建和运营、支持软件交付和生命周期管理的自助式内部开发者平台的机制和架构,涉及全部提供通用服务和工具的系统,通过它可以: •使用自服务的方式来加快发布速度,减少与运维持续沟通的成本投入;•将底层的复杂性抽象化,降低个人心智负担,让研发工作更专注;•降低发布流程对高级工程师的重度依赖,减少资源浪费; 从而减少研发交付中的复杂性及不确定性,从而优化开发者体验并提升研发“生产力”。平台工程化特征 开发者体验 关注点分离 自助式服务 资产沉淀复用 能力标准化 G O P S全 球 运 维 大 会2 0 2 3·上 海 站 一体化平台建设思考:从形聚到神合,打造完整研发用户旅程 泰康研发一体化平台的建设已完成第一阶段(形聚集成):基于现有工具梳理关键节点,打通核心主流程; 平台工程化后(神合),将囊括各个状态,以提升“DX”及平台工程为核心,建设一体化研发平台,赋能研发全生命周期。 开放运维联盟高效运维社区DevOps时代 荣誉出品