cacti与nagios的 主动,被动监控

简介:

        我一直比较赞同的是主动请求式的监控模式,主要原因是被动探测会给监控结点带来很大的压力,就Cacti而言,用Spine轮询,共35个设备,每分钟轮询一次,能吃掉我35%的CPU。
相比之下,通过客户机主动发送请求给监控机的Ganglia,占用资源就非常小。一台监控机估计挂200台客户机监控不是问题。
区别就在于,主动请求式是客户机把自己的监控信息主动发送给监控机,监控机只要接收这些信息处理即可。
被动探测式是监控机把监控请求发送到客户机,客户机接到请求把需要的监控信息返回给监控结点。
所以,被动探测式会给监控机带来很大的压力,因为它要不断的发请求去获取信息。

但是监控宝的同志做了个很好的比方,让我想法有了些变化。
监控机好比警察,客户机好比犯人。
不能因为警察忙,就不管犯人,让犯人主动报告自己的情况。
如果犯人突然没信息了,警察就不知道犯人是死了还是跑了。
并且如果警察调走了,犯人不知道,这一群犯人就不知道向谁报告了。
但是经常也不能老去一直问犯人的情况,那样他的工作效率就太低了。
所以二者各有好处。

首先,警察很忙的时候,让犯人主动报告自己的情况,他记着就行。
但是,一旦犯人在规定的时间没报告,警察就要主动去联系了,看看犯人到底是死了还是跑了。

还原到监控中,就是主动与被动两种方式结合起来。
一般情况下,让客户机比较高频地自己报告情况情况给监控机,同时,监控机间隔比较长的像客户机主动发送请求,检查客户机是否存活。
同时,一旦监控机在规定的时间内没收到客户机的信息,就要像客户机发请求去轮询,确认客户机的状态。

主动和被动在合适的时候都有合理的用处,像手机就是主动向基站报告自己加入,雷达又是向被监控区域发送探测信号。
任何方法都有其存在的理由,没有最好没有最坏,只有最合适


===============================================================================

下面是我自己对cacti,nagios的监控方式(主动-被动)


nagios :可以说既是主动方式监控,也是被动监控

主动监控:

我们需要在被监测主机上部署NRPE,他相当于一个守护进程负责监听。而监测主机使用check_nrpe并通过SSL连接访问这个daemon,然后调用被监测方的check_disk,check_load等脚本获取信息并将结果传递到监测主机,这样的好处是监控主机不会有很大的压力,负载。

被动监控:

有时候我们还需要监控,从监控主机到被监控主机之间的网络情况,如connect,ping  hardware 以及各种应用程序,都是通过被动方式进行周期性监控的。


cacti:(被动监控方式)

就Cacti而言,用Spine轮询,每次都是通过监控主机来请求监控被监控机的监控状况,加入机器过多,肯定会造成监控机的负载过高、





      本文转自crazy_charles 51CTO博客,原文链接:http://blog.51cto.com/douya/1600526,如需转载请自行联系原作者






相关文章
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32698 79
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17751 20
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36682 19
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24758 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36660 15
重生之---我测阿里云U1实例(通用算力型)
|
SQL 存储 弹性计算
Redis性能高30%,阿里云倚天ECS性能摸底和迁移实践
Redis在倚天ECS环境下与同规格的基于 x86 的 ECS 实例相比,Redis 部署在基于 Yitian 710 的 ECS 上可获得高达 30% 的吞吐量优势。成本方面基于倚天710的G8y实例售价比G7实例低23%,总性价比提高50%;按照相同算法,相对G8a,性价比为1.4倍左右。
|
存储 算法 Java
【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的限流器RateLimiter功能服务
随着互联网的快速发展,越来越多的应用程序需要处理大量的请求。如果没有限制,这些请求可能会导致应用程序崩溃或变得不可用。因此,限流器是一种非常重要的技术,可以帮助应用程序控制请求的数量和速率,以保持稳定和可靠的运行。
29838 52

热门文章

最新文章

下一篇
开通oss服务