Zabbix分布式监控系统使用总结

简介:

    从接触和使用Zabbix已经有2年多的时间,刚开始接触也就是从Zabbix安装,使用和简单的维护开始学习。到后来涉及到如何添加监控主机?如何自定义监控项?如何设置报警阀值?等开始学习。
    有幸在2013年底从零开始研究和选型整个公司IDC监控系统。由于Zabbix简单易用和强大功能,决定用Zabbix做为公司的监控系统。整个公司有多个IDC机房,监控节点有700左右,采用Zabbix分布式来监控。
    现在Zabbix上线已经接近一年的时间,运行非常稳定,打开页面速率流畅。在这一年的多的时间里面,也发表了一系列文章,主要包括Zabbix监控和分布式部署和实施方案、Zabbix如何监控网络设备、Zabbix 后台数据操作和API等。希望对广大朋友所有帮助。
    1)Zabbix监控和分布式部署实施方案
    
http://sfzhang88.blog.51cto.com/4995876/1364399
    2)Zabbix分布式部署proxy实战
    
http://sfzhang88.blog.51cto.com/4995876/1529967
    3)Zabbix如何监控网络设备
    
http://sfzhang88.blog.51cto.com/4995876/1431623
    4)Zabbix如何监控Windows机器
    
http://sfzhang88.blog.51cto.com/4995876/1545761
    5)Zabbix通过Shell脚本监控HP服务器硬件信息
    
http://sfzhang88.blog.51cto.com/4995876/1413009
    6)Zabbix通过SNMP监控HP服务器硬件信息
    
http://sfzhang88.blog.51cto.com/4995876/1595211
    7)通过Zabbix全面监控NetScaler负载均衡设备
    
http://sfzhang88.blog.51cto.com/4995876/1651513
    8)Zabbix监控mysql数据库性能
    
http://sfzhang88.blog.51cto.com/4995876/1379859
    9)如何从Zabbix数据库中获取监控数据 
    
http://sfzhang88.blog.51cto.com/4995876/1558254
    10)Zabbix Python API 应用实战
   
 http://sfzhang88.blog.51cto.com/4995876/1552916

    做好监控系统,最重要的其实就是两点,首先是监控项目的设置。根据系统、业务设置最能代表监控项目的性能指标。其次是报警阈值的设置。根据业务指标设置精准的报警阈值。比如说监控Apache的httpd进程数监控,如果MaxClients设置200,那么当httpd进程在180的时候必须报警,如果在200的时候报警,此时由于httpd进程爆满已经打不开页面了或者打开网站的速度非常慢。

    下面是平时工作中总结的Zabbix报警阈值的设置,主要包括Linux系统、Windows系统、服务器硬件监控、网络设备和线路的监控的报警阈值的设置。

    1)Linux系统的报警阈值,这里增加了Linux僵尸进程的监控。

wKiom1XS1GzgXKOEAAPOQ175b4g376.jpg

    2)Windows系统的报警阈值,perf_counter是通过windows的性能计数器获取的数据。

wKiom1XS1IDwdHxSAAMGoF_Ihf8115.jpg

    3)SQLServer和IIS的报警阈值,其中perf_counter是通过windows的性能计数器获取的数据,Check_IIS_perf.sh是通过脚本以External check方式监控的。

wKiom1XS1I3jr6kDAAONCvAT918391.jpg

    4)HP硬件的监控,主要是通过SNMP协议和Zabbix discovery方式来监控。

wKioL1XS1qWjTe5xAAEc_8ao3ag665.jpg

    5)其它方面的监控,主要是应用程序的监控。

wKiom1XS1KTjGGy_AAvlJxB-Dtg815.jpg

    最后,发表此文章的主要目的是和广大朋友相互交流和相互学习,在一些自定义监控项目上面提供更多一点自己的想法和使用经验,如果在系统和应用的监控方面有更多好的想法,欢迎相互交流。











本文转自 sfzhang 51CTO博客,原文链接:http://blog.51cto.com/sfzhang88/1685537,如需转载请自行联系原作者

目录
相关文章
|
6天前
|
监控 Java 应用服务中间件
tomcat相关概念与部署tomcat多实例-zabbix监控(docker部署)
通过上述步骤,您可以在Ubuntu系统上成功编译并安装OpenCV 4.8。这种方法不仅使您能够定制OpenCV的功能,还可以优化性能以满足特定需求。确保按照每一步进行操作,以避免常见的编译问题。
36 23
|
7天前
|
监控 Java 应用服务中间件
tomcat相关概念与部署tomcat多实例-zabbix监控(docker部署)
通过上述步骤,您可以在Ubuntu系统上成功编译并安装OpenCV 4.8。这种方法不仅使您能够定制OpenCV的功能,还可以优化性能以满足特定需求。确保按照每一步进行操作,以避免常见的编译问题。
38 22
|
10天前
|
监控 Java 应用服务中间件
tomcat相关概念与部署tomcat多实例-zabbix监控(docker部署)
通过上述步骤,您可以在Ubuntu系统上成功编译并安装OpenCV 4.8。这种方法不仅使您能够定制OpenCV的功能,还可以优化性能以满足特定需求。确保按照每一步进行操作,以避免常见的编译问题。
50 25
|
3天前
|
存储 运维 安全
盘古分布式存储系统的稳定性实践
本文介绍了阿里云飞天盘古分布式存储系统的稳定性实践。盘古作为阿里云的核心组件,支撑了阿里巴巴集团的众多业务,确保数据高可靠性、系统高可用性和安全生产运维是其关键目标。文章详细探讨了数据不丢不错、系统高可用性的实现方法,以及通过故障演练、自动化发布和健康检查等手段保障生产安全。总结指出,稳定性是一项系统工程,需要持续迭代演进,盘古经过十年以上的线上锤炼,积累了丰富的实践经验。
|
5天前
|
存储 分布式计算 Hadoop
基于Java的Hadoop文件处理系统:高效分布式数据解析与存储
本文介绍了如何借鉴Hadoop的设计思想,使用Java实现其核心功能MapReduce,解决海量数据处理问题。通过类比图书馆管理系统,详细解释了Hadoop的两大组件:HDFS(分布式文件系统)和MapReduce(分布式计算模型)。具体实现了单词统计任务,并扩展支持CSV和JSON格式的数据解析。为了提升性能,引入了Combiner减少中间数据传输,以及自定义Partitioner解决数据倾斜问题。最后总结了Hadoop在大数据处理中的重要性,鼓励Java开发者学习Hadoop以拓展技术边界。
29 7
|
1月前
|
运维 监控 BI
zabbix强大的报警系统
zabbix强大的报警系统
61 8
|
1月前
|
监控 安全 前端开发
使用 Zabbix 监控堆外应用
使用 Zabbix 监控堆外应用
55 9
|
1月前
|
监控 数据可视化 Java
zabbix全面的监控能力
zabbix全面的监控能力
97 7
|
1月前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
84 4
|
2月前
|
监控 Java Shell
监控堆外第三方监控工具Zabbix
监控堆外第三方监控工具Zabbix
49 5

热门文章

最新文章

推荐镜像

更多