您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国信通院]:安全生产治理核心要素:管理、运营案例解读 - 发现报告

安全生产治理核心要素:管理、运营案例解读

AI智能总结
查看更多
安全生产治理核心要素:管理、运营案例解读

杨德华数列科技联合创始人、解决方案负责人 在说话的人是谁?--自我介绍 杨 德 华 数列科技联合创始人/资深解决方案架构师 ⚫超过10年的超大流量复杂系统的高可用架构、性能优化实践 ⚫信通院数字政府建设赋能计划技术专家成员 ⚫历经2009年-2016年电商平台双十一大促技术保障 ⚫2017年至今:数列科技,为众多知名企业合作建设系统安全生产体系,包括中国人寿、中国移动、国家电网、顺丰、中通、SHEIN等 数列科技这家公司是干啥的?和大家有啥关系? 愿景:帮助企业高效建设安全生产体系,有效提升系统稳定性,保障企业业务发展和用户体验 目录:今天要分享什么内容? 1.背景数字化时代特点、微服务架构优劣点、系统不可用对企业的影响 2.安全生产两个实践案例的效果对比 3.安全生产治理概念和要素理解 4.安全生产总体治理框架、参考框架、落地步骤 1.1数字化时代特点:快 •市场剧烈变化•7x24小时的服务•更短的产品生命周期•更多的定制化服务•产品发布周期(TTM)更短•VUCA 新产品、新业务玩法的创新速度成为企业增长的动力而云原生、微服务架构的引入,有助于提升企业创新速度 1.2分布式、云原生架构的优缺点 1.3系统一分钟不可用,对企业的影响估算 Gartner:Downtime can cost small businesses$423per minute,whereas large organizations can lose over$9,000per minute. 目录:今天要分享什么内容? 1.背景数字化时代特点、微服务架构优劣点、系统不可用对企业的影响 2.安全生产两个实践案例的效果对比 3.安全生产治理概念和要素理解 4.安全生产总体治理框架、参考框架、落地步骤 2.1案例一:顺丰+Takin2021双十一生产环境全链路压测效果 _330_个服务、6400个agent运行8、9、10月持续3个月压测,大规模压测次数达20次 2.2顺丰快递+Takin:生产环境全链路压测 四步保障 2.4顺丰、B企业的管理、组织方式对比 目录:今天要分享什么内容? 1.背景数字化时代特点、微服务架构优劣点、系统不可用对企业的影响 2.安全生产两个实践案例的效果对比 3.安全生产治理概念和要素理解 4.安全生产总体治理框架、参考框架、落地步骤 3.1数字化业务安全生产治理概念内涵理解 广义:全社会 安全生产治理是国家有关部门、行业组织、科研机构、企业、个人共同参与和实施的一系列活动集合。 完善相关政策法规 推动政策法规落地 狭义:单个组织内部 在组织安全生产战略的指导下,为确保系统处于稳定性运行的状态,多个部门协作实施的一系列活动集合。在组织安全生产战略的指导下,为确保系统处于稳定性运行的状态,多个部门协作实施的一系列活动集合。 制定相关制度规范标准 发展数字经济,必须把数字化业务安全生产、保障业务连续性放在突出位置。 需着力解决安全生产领域的突出问题,有效提升安全生产治理能力 3.2云原生、微服务架构数字化系统的安全生产难题 技术高管视角 用户视角 1.做一次发布,很容易出问题,运维给了很多检查项,要看很多监控。2.排查问题的数据分散、缺失,获取数据验证的成本高 1.如何高效保障数字化系统平稳运行? 85%的故障靠用户反馈或者投诉 运维部门视角 1.业务服务于用户和客户,但是保障体系服务于应用和组件 客服、业务部门视角 2.接受的告警数量很多,准确率很低 3.告警配置的覆盖率很低 异常定位的效率特别低,协同的人员多,时间长 4.发布频次提升,告警配置的维护成本很高 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 3.4.1研发全生命周期视角 目录:今天要分享什么内容? 1.背景数字化时代特点、微服务架构优劣点、系统不可用对企业的影响 2.安全生产两个实践案例的效果对比 3.安全生产治理概念和要素理解 4.安全生产总体治理框架、参考框架、落地步骤 3.6安全生产应该怎样有效抓起来? 4.3数字化系统安全生产战略 从组织的顶层规划方面提出要求,为稳定性保障治理体系的建设定目标、建团队。 安全生产(稳定性保障)治理规划 组织管理 关注组织安全生产治理的团队建设、以及相关岗位的安全生产管理规范 关注组织在安全生产治理方面的发展规划情况 团队及人员构成 目标及任务 人员生产安全管理 团队分工及考核 4.4系统研发全生命周期稳定性保障治理 以系统需求、设计、编码、测试、发布、变更、监控、应急、重保各个环节为切入点,设置相应的安全生产风险管控点和管理运营流程,对系统需求全流转过程进行规范和约束。 4.5稳定性保障和提升行业最佳实践能力 以系统需求、设计、编码、测试、发布、变更、监控、应急、重保各个环节为切入点,设置相应的安全生产风险管控点和管理运营流程,对系统需求全流转过程进行规范和约束。 4.6安全生产治理实践步骤:1.治理规划 在组织启动稳定性保障治理工作前,必须制定相应的规划,明确治理目标和具体任务,匹配对应的资源,使得治理工作能够有条不紊的展开。 •现状风险分析:结合业务发展需求,梳理风险清单,提炼安全生产建设要点 •行业最佳实践对比:现状梳理,明确差距、找到问题。 •组织机构建设 •可行性分析:投入vs产出•可靠性分析:方案本身的可靠性•可持续性分析:发展兼容 方案论证 4.6-2围绕目标,结合核心业务链路,打造三大能力 4.7安全生产治理实践步骤:2.治理建设-组织架构体系 明晰的组织体系是保障安全生产工作顺利开展的首要条件。 安全生产领导小组:“一号位负责制”•高层管理者 •业务部门领导•技术部门领导等 安全生产管理团队:由领导小组指派•高层领导者 安全生产执行团队•各业务研发部门与产品人员•运维、测试等人员 4.8安全生产治理实践步骤:3.治理建设-制度流程体系 制度流程作为安全生产生产治理要求、管理策略、操作规程等的集合 4.9安全生产治理实践步骤:4.治理建设-技术工具体系 安全生产战略 4.11风险提醒、推动改进、峰值流量验证 4.12安全生产治理实践步骤:5.治理建设-人员能力体系 安全生产治理离不开相应人员的具体执行,加强对安全生产人才的培养是安全生产治理的重要支撑。 安全生产意识培养 结合实际场景,定期推送知识要点,培养全员安全生产意识宣传视频宣传海报宣传手册 •问题触发式培训•培训不深入•课题体系不成熟•讲师水平参差不齐•考核不规范 安全生产能力培训 利用线上平台+线下授课的方式,定期进行培训专题学习线上直播线下讲坛通过安全生产攻防对抗等实战演练,进行动态培训攻防演练红蓝对抗 安全生产能力考核 建设考核平台,用于考察员工的安全意识和安全能力入职/晋升考核日常测验专项考试 4.13安全生产治理实践步骤:6.治理运营 安全生产治理的持续运营,能够打通各环节的建设内容,促进整个体系的良性发展。 风险防范 4.17安全生产治理实践步骤:7.治理成效评估 安全生产治理是一个持续性过程,成效评估是考核组织安全生产治理能力的重要环节,其结果也是新一轮安全生产治理的改进依据。 第三方评估 内部评估 •应由组织管理层牵头,执行层和监督层配合执行。•应将评估结果与组织的绩效考核挂钩,避免评估流于形式 •信通院等专业机构开展安全生产相关评估工作 •对比标准、现状,找出差距 THANKS! 数列科技杨德华18506859870微信:whitepoplar Takin开源交流钉钉群:44813943