开发者社区> 余二五> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Zabbix分布式监控系统使用总结

简介:
+关注继续查看

    从接触和使用Zabbix已经有2年多的时间,刚开始接触也就是从Zabbix安装,使用和简单的维护开始学习。到后来涉及到如何添加监控主机?如何自定义监控项?如何设置报警阀值?等开始学习。
    有幸在2013年底从零开始研究和选型整个公司IDC监控系统。由于Zabbix简单易用和强大功能,决定用Zabbix做为公司的监控系统。整个公司有多个IDC机房,监控节点有700左右,采用Zabbix分布式来监控。
    现在Zabbix上线已经接近一年的时间,运行非常稳定,打开页面速率流畅。在这一年的多的时间里面,也发表了一系列文章,主要包括Zabbix监控和分布式部署和实施方案、Zabbix如何监控网络设备、Zabbix 后台数据操作和API等。希望对广大朋友所有帮助。
    1)Zabbix监控和分布式部署实施方案
    
http://sfzhang88.blog.51cto.com/4995876/1364399
    2)Zabbix分布式部署proxy实战
    
http://sfzhang88.blog.51cto.com/4995876/1529967
    3)Zabbix如何监控网络设备
    
http://sfzhang88.blog.51cto.com/4995876/1431623
    4)Zabbix如何监控Windows机器
    
http://sfzhang88.blog.51cto.com/4995876/1545761
    5)Zabbix通过Shell脚本监控HP服务器硬件信息
    
http://sfzhang88.blog.51cto.com/4995876/1413009
    6)Zabbix通过SNMP监控HP服务器硬件信息
    
http://sfzhang88.blog.51cto.com/4995876/1595211
    7)通过Zabbix全面监控NetScaler负载均衡设备
    
http://sfzhang88.blog.51cto.com/4995876/1651513
    8)Zabbix监控mysql数据库性能
    
http://sfzhang88.blog.51cto.com/4995876/1379859
    9)如何从Zabbix数据库中获取监控数据 
    
http://sfzhang88.blog.51cto.com/4995876/1558254
    10)Zabbix Python API 应用实战
   
 http://sfzhang88.blog.51cto.com/4995876/1552916

    做好监控系统,最重要的其实就是两点,首先是监控项目的设置。根据系统、业务设置最能代表监控项目的性能指标。其次是报警阈值的设置。根据业务指标设置精准的报警阈值。比如说监控Apache的httpd进程数监控,如果MaxClients设置200,那么当httpd进程在180的时候必须报警,如果在200的时候报警,此时由于httpd进程爆满已经打不开页面了或者打开网站的速度非常慢。

    下面是平时工作中总结的Zabbix报警阈值的设置,主要包括Linux系统、Windows系统、服务器硬件监控、网络设备和线路的监控的报警阈值的设置。

    1)Linux系统的报警阈值,这里增加了Linux僵尸进程的监控。

wKiom1XS1GzgXKOEAAPOQ175b4g376.jpg

    2)Windows系统的报警阈值,perf_counter是通过windows的性能计数器获取的数据。

wKiom1XS1IDwdHxSAAMGoF_Ihf8115.jpg

    3)SQLServer和IIS的报警阈值,其中perf_counter是通过windows的性能计数器获取的数据,Check_IIS_perf.sh是通过脚本以External check方式监控的。

wKiom1XS1I3jr6kDAAONCvAT918391.jpg

    4)HP硬件的监控,主要是通过SNMP协议和Zabbix discovery方式来监控。

wKioL1XS1qWjTe5xAAEc_8ao3ag665.jpg

    5)其它方面的监控,主要是应用程序的监控。

wKiom1XS1KTjGGy_AAvlJxB-Dtg815.jpg

    最后,发表此文章的主要目的是和广大朋友相互交流和相互学习,在一些自定义监控项目上面提供更多一点自己的想法和使用经验,如果在系统和应用的监控方面有更多好的想法,欢迎相互交流。











本文转自 sfzhang 51CTO博客,原文链接:http://blog.51cto.com/sfzhang88/1685537,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
一文看懂分布式链路监控系统
本文通过阿里的Eagleeye(鹰眼)和开源的Skywalking,从数据模型、数据埋点以及数据存储三个方面介绍分布式链路监控系统的实现细节,其中将重点介绍Skywalking字节码增强的实现方案。
0 0
分布式统一监控系统架构图与设计思路| 学习笔记
快速学习分布式统一监控系统架构图与设计思路。
0 0
分布式统一监控系统架构图与设计思路
一、问题解答 二、分布式统一系统 三、统一监控系统架构图 四、设计思路
0 0
用SkyWalking做分布式追踪和应用性能监控系统
SkyWalking 是观察性分析平台和应用性能管理系统。提供分布式追踪、服务网格遥测分析、度量聚合和可视化一体化解决方案。
0 0
深入解读面向微服务的分布式秒级监控系统Infinsight
在云服务环境中,服务的质量一向是云服务厂商关注的重点,为了保证云服务质量的最大化,以及在出现故障时能够协助用户对故障进行快速的定位,监控服务在其中起着非常重要的作用。
662 0
.Net架构篇:思考如何设计一款实用的分布式监控系统?
前言 无论从最早期的unix操作系统,还是曾经大行其道的单体式应用,还是现在日益流行的微服务架构,始终都离不开监控的身影。如windows的任务管理器,linux的top命令,都可以看作是监控的面板。
973 0
企业级分布式监控系统--zabbix
1.Zabbix简介   Zabbix 是一个企业级的分布式开源监控方案。 2.zabbix安装 zabbix重要的不是部署,而是学会操作使用,所以推荐大家进行一键部署。 手动部署可参考官方文档:https://www.
2907 0
分布式监控系统Zabbix3.2对数据库的连接数预警
  在前篇分布式监控系统Zabbix3.2监控数据库的连接数 中已经对数据库的端口3306进行了监控,可以看到数据库的连接数历史变化有高有低,那如果达到了数据库连接数的阀值是不是主动通知给运维人员去检查问题呢,总不能实时盯着看吧,下面就怎么配置预警作简单介绍。
1530 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
云原生时代下的分布式云多集群管理-容灾,弹性,多集群负载分布
立即下载
让 MySQL 原生分布式触手可及
立即下载
事务、全局索引、透明分布式
立即下载