您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[观远数据]:观远数据云巡检最佳实践 - 发现报告
当前位置:首页/其他报告/报告详情/

观远数据云巡检最佳实践

2023-08-25观远数据「***
观远数据云巡检最佳实践

版权所有©杭州观远数据有限公司2022。保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。商标声明和其他观远数据商标均为杭州观远数据有限公司的商标。本文档提及的其他所有商标或注册商标,由各自的所有人拥有。注意您购买的产品、服务或特性等应受观远数据商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,观远数据对本文档内容不做任何明示或暗示的声明或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用参考,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。 目录1.概述.....................................................................................................................52.前置条件..............................................................................................................73.系统运维最佳实践..............................................................................................93.1问题场景....................................................................................................93.2整体思路....................................................................................................93.3具体实践.................................................................................................123.3.1标准配置......................................................................................123.3.2资源水位持续高..........................................................................123.3.3特定时段异常..............................................................................143.3.4单点异常......................................................................................163.4优化方式.................................................................................................183.4.1系统资源告警..............................................................................183.4.2任务运行控制..............................................................................194.业务治理最佳实践............................................................................................204.1问题场景.................................................................................................204.2整体思路.................................................................................................204.3具体实践.................................................................................................214.3.1低价值业务识别与治理...............................................................214.3.2高价值业务识别与保障...............................................................224.4业务优化.................................................................................................254.4.1定位问题作业..............................................................................25 4.4.2判断清理与否..............................................................................264.4.3灰度下线......................................................................................265.运营管理最佳实践............................................................................................285.1风险管理.................................................................................................285.1.1系统风险-系统运维.................................................................285.1.2安全风险......................................................................................285.2用户运营.................................................................................................295.2.1用户License管理....................................................................295.2.2不活跃用户处理..........................................................................295.2.3企业数字文化推广......................................................................30附常见问题解决方案...........................................................................................32 1.概述随着BI平台逐渐深入企业的运营流程,BI平台的运维或管理的负责人通常会面临一个繁复且艰难的问题,就是对系统运行指标的监控、告警及问题处理。对此,观远数据提供了「云巡检」这一云端智能巡检服务,帮助用户基于云巡检的自动巡检与诊断,对BI系统进行主动运维,排除问题,提高系统稳定性和业务效率。为了帮助用户更好地理解并使用云巡检,利用云巡检来找到关键的问题发生时间、涉及资源、关联业务场景等,进而采取解决方案,观远数据特此提供最佳实践,为用户带来行动参考。具体常见问题部分如下:系统资源水位是否异常?不同异常该如何应对?ETL运行任务总是跑不出来是为什么?BI看板数据加载慢的可能原因是什么?该如何定位问题原因?BI系统内的业务,都是有效业务么?都是有价值的么?该如何判断?云巡检(也称云端诊断、智能运维),是观远数据提供的智能运维服务,以产品形式分享观远数据多年沉淀的数字化管理技术,一站式全联接,让IT运维更智能。通过云巡检,用户无须通过人力去拉取BI系统的集群资源、运行情况相关数据,根据云巡检自动生成的可视化分析结果报告,可以快速发现相关问题,并快速获取可优化/解决方案建议,减少日常运维工作的成本,并提前计划好容量规划。本文将从三个方面分享关于「云巡检」使用的最佳实践:■对系统风险进行诊断,按需进行合理的容量规划 基于系统监控指标,对系统性能进行巡检、诊断、预警;对于风险预警,根据行动建议做及时处理。基于系统监控指标,如系统整体性能、水位情况等,以及业务发展情况,做扩容规划。■对业务资产及其使用情况进行诊断,进行治理和优化基于系统监控指标,识别低价值业务资产,对无价值或低价值的业务资产进行治理,有效回收资源。基于系统监控指标,识别业务作业潮汐,对业务作业高峰进行合理规范与调度。■对于系统运行与用户行为情况进行诊断,识别系统与数据安全风险,提前防范基于监控指标,识别异常行为,对高风险行为进行规范,有效避免安全问题。基于监控指标,识别异常用户与核心用户,针对性采取运营措施。 2.前置条件在执行本实践前,您需要完成以下准备工作:■产品基础首先,已经开通了观远数据服务,并完成部署实施流程。其次,开通了云巡检功能模块,并完成云巡检报告生成流程。■账号角色注册观远数据BI账号,成为“管理员”,确认您可以进入“管理员设置”与“云巡检”功能板块。■概念须知为了让您更好地实践,请先了解以下概念:云巡检:也称云端诊断、智能运维,是观远数据提供的智能运维服务,以自动获取系统运行数据的方式进行系统诊断,通过可视化报告为用户呈现系统运行状况,帮助用户识别系统与数据安全相关风险,积极应对与决策。系统性能:也称计算机系统性能,计算机系统由计算机硬件和软件两部分组成。硬件包括中央处理机(CPU)、存储器和外部设备等;软件包括计算机的运行程序和相应的文档。系统性能有多种衡量尺度,一般是指系统资源利用率、系统吞吐量以及响应时间等指标。资源容量:包含CPU、内存算力资源,及磁盘的用量,精准的容量规划,可以帮助业务的快速发展,避免算力支持成为业务发展的瓶颈、阻碍项。ETL:指观远数据业内首创智能数据准备(SmartETL,也称智能ETL、ETL),可达到专业级的数据处理效果,旨在让用户在数据分析、数据可视化制作前,能 够对数据集进行易操作、低门槛、智能化的高效数据处理,使数据经过清洗、转换、装载后得到对终端业务人员更有效的数据集。CPU负载:指CPU的承载能力,通常可理解为一段时间内的总任务数/CPU核数。CPU是电子计算机的主要设备之一,电脑中的核心配件,负责读取指令,对指令译码并执行指令。■实践路径说明:诊断目标可以分为系统