登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
九江银行Zabbix监控系统实践 - 张义
金融
2022-12-14
2022第7届Zabbix中国峰会
华***
AI智能总结
查看更多
Zabbix监控平台建设历程与实践经验分享
项目背景与原有监控平台痛点
项目背景
:为贯彻落实“数字九银”战略目标,加强故障预警和自愈能力,提升运维自动化和智能化水平,九江银行启动了新的一体化基础监控平台建设。
原有监控平台痛点
:部分功能较弱(历史数据存储、分析困难;告警条件设置灵活差),缺乏自动化手段,对新技术适应性差,厂商支持力度不够。
基础监控平台选型
选型过程
:对比Zabbix、Prometheus、Openfalcon、Nagios等,综合考虑自主可控、周期、成本、灵活性、扩展性等因素,选择开源基础监控平台Zabbix,并辅以人力服务或项目模式。
选择Zabbix的优势
:满足需求、媲美商业软件、国内完善服务支持、全开源解决方案。
Zabbix监控平台建设阶段
调研阶段(2019-2020)
:进行基础监控平台、统一事件管理平台、智能分析平台的调研和测试。
深化阶段(2020-2021)
:上线基础监控平台,对接统一事件管理平台和智能分析平台,实现指标全覆盖,完善监控体系。
探索阶段(2021-2022)
:持续优化监控系统,拓展运维场景,探索AIops和故障自愈。
项目收益
实现基础监控指标全覆盖
实现基础监控规范化、标准化、自动化
提高运维效率,解放运维生产力
提升数字化运营水平和安全运营水平
Zabbix监控平台架构设计
高可用性
:Zabbix Server及各模块采用Keepalived实现高可用,数据库采用MySQL双主模式。
数据传输
:通过Zabbix Server的real time export功能将数据推送到统一事件平台和智能分析平台。
系统集成
:通过API、SQL语句实现与运维门户、数据展示系统的对接。
Zabbix监控对象类别
操作系统
:Linux、AIX、Windows(Agent)
数据库
:Oracle、Informix、SQL Server等(Agent+自定义脚本)
中间件
:IBM WAS、IBM MQ、Tomcat等(JMX、Agent+自定义脚本)
应用
:端口、进程、ICMP、WEB URL等(Agent+自定义脚本)
虚拟化
:VMware(Simple check(API))
硬件
:服务器、网络设备、存储设备(SNMP、SSH、Rest API等)
Zabbix监控规模
主机:9500+
监控项:58万
触发器:36万
Proxy:4
模板:98
用户数:64
Zabbix实践经验分享
基于光纤交换机的光链路监控
:通过管理机部署采集程序,定期自动发现监控项,将数据传到Zabbix Server。
统一事件和智能分析
:实现统一事件管理、性能查看、趋势预测、根因分析。
容量分析
:每天分析即将超过阈值的容量信息,定期出具容量分析报告。
文件系统和表空间自动扩容
:支持文件系统扩容、Oracle ASM和表空间扩容,效率提升10倍。
统计报表
:通过Grafana展示CPU使用率告警次数、内存使用率告警次数等,数据通过SQL语句从数据库获得。
监控优化
:持续优化监控配置和性能。
对未来监控的展望
运维走向运营
:以业务为导向,以数据为依据,实现监控的数字化转型。
运维工具平台化
:整合现有工具链,实现运维数据标准化和工具平台化。
可观测性监控体系构建
:基于指标、日志、调用链的可观测性监控体系。
智能化监控
:利用大数据技术和智能算法实现告警根因分析、故障自愈。
Zabbix开源社区支持体系
社区支持
:每天社群交流、每周每月每年技术交流会、中文使用手册、图书等。
支持体系
:在线课程、认证培训、方案咨询、实施和订阅等。
你可能感兴趣
蔡飞志:看Zabbix如何基于OceanBase高效解决监控系统三大痛点
信息技术
OceanBase
2024-08-23
监控无边界-ZABBIX与信创生态的融合-周松
信息技术
2022第7届Zabbix中国峰会
2022-12-14
真实应用场景出发:漫谈Zabbix在网络监控领域的实战
上海宏时数据系统有限公司
2023-05-05
Zabbix对Trap监控功能探秘 - 王军
信息技术
2022第7届Zabbix中国峰会
2022-12-14
山东省中医院基于ZABBIX构建网络设备监控预警平台-董晨
医药生物
2022第7届Zabbix中国峰会
2022-12-14