开发者社区> skyme> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Nagios 简介及其二次开发

简介:
+关注继续查看
Nagios简介

Nagios是十分受欢迎的、开源且免费的计算机及网络系统监控软件。Nagios是“Nagios Ain‘t Gonna Insist On Sainthood”的缩写。它最早是在1999年以“NetSaint”发布。Nagios主要应用在Linux和Unix平台环境下的监控,但通过插件,也可以监控MS Windows系统的主机。Nagios在LinuxCon 2010 Poll并选为最受欢迎的IT运维工具。它被Infoworld在2009年评为最佳开源软件,同时也是该年度的SourceForge社区的系统管理工具最佳选择。Nagios也被很多知名企业所采用,包括AOL,DHL,At&t,欧莱雅,德州仪器,Siemens COM CZ,时代华纳有线,Yahoo等。

8257165_1323350964vSKk.jpg

Nagios的特征包括:

l    监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);

l    监控主机资源(处理器负荷、磁盘利用率等);

l    并行服务检查机制;

l    具备定义网络分层结构的能力,用”parent”主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态,提供设备组网拓扑展示能力;

l    当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);

l    具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多问题定位;

l    简单地插件设计使得用户可以方便地扩展自己服务的检测方法;

l    自动的日志轮转;

l    可以支持并实现对主机的冗余监控;

l    可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;

     二次开发

Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。启动 Nagios后,它会周期性的自动调用插件去检测服务器状态,同时 Nagios 会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首开始读取信息,并进行处理后,把状态结果通过 web 显示出来。

Nagios Plug-in机制

Nagios Daemon通过加载一些官方的或其它自开发的插件(Plug-in),能够实现对诸如服务器、网络、应用甚至房间温度和湿度等的监控。Nagios Core作为Nagios Daemon的核心,负责对这些插件的结果进行处理(诸如统计、转储、人工或自动响应处理等)。因此Nagios Core即为Nagios的事件池的核心。在Nagios Core内部,它为每一种加载的插件都会分配独立的工作缓冲区(即以objecttype作为区分),以存放相应插件所产生的事件信息。每一个独立运行的Nagios Daemon可以有自己的名称以便集群Nagios环境下的相互区别,即从更大的层面来区分这些工作缓冲区。

Nagios插件通常是通过命令行方式监控主机或服务工作状态的脚本,由Nagios进行按需调用,并把执行结果返回给Nagios。Nagios正是根据这些返回值来判断是否“采取某种行动”(如运行事件句柄(event handlers),发送通知等)。下图展示了插件相对于Nagios进程和被监控对象间的关系:

8257165_1323350543B69E.jpg

为了管理插件,Nagios 每次在查询一个服务的状态时,产生一个子进程,并且它使用来自该命令的输出和退出代码来确定具体的状态。

下面提供了一个 Python 示例脚本,用于检查 UNIX® 平均负载。它假定 2.0 以上的级别表示警告状态,而 5.0 以上的级别表示危险状态。这些值都采用了硬编码的方式,并且始终使用最近一分钟的平均负载。

 

8257165_13233507073rxW.jpg

Nagios Add-on机制

Nagios支持以Add-on方式扩展监控信息处理能力。Nagios采集到的监控信息都被看做事件,事件接收者对感兴趣的事件注册,事件发生时Nagios的事件机制会将事件发送到事件接收者。Nagios的Add-on就是事件接收者。Add-on通过将自身注册到感兴趣的事件上,可以实时的从Nagios接收到事件,并作出相应处理。

Nagios Add-on工作原理图:

8257165_1323350734H8PN.jpg

Nagios监控效果: 

 

8257165_1323350776OhIK.jpg

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Nacos简介
前四个字母分别为Naming和Configuration的前两个字母,最后的s为Service。
56 0
Nagios学习
基本介绍 先把一些常见的术语搞清楚。Nagios不仅仅是一个监控软件,其实更多像一个监控的框架,形成了一个生态圈,所以你需要了解他周围的东西很多。 Nagios介绍 自己以前转载过一篇文章原文,介绍的倒是很详细,只是当时没看懂,这次倒是用上。 监控软件,以前我倒是研究过一下,无非就两种:基于SNMP和通过agent来实现。基于SNMP,可以获得的数据会比较少,Agent的会比较多一
1498 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
PHP与APM_技术内幕和最佳实践
立即下载
使用C++11开发PHP7扩展
立即下载
《Zabbix 监控常用手册》
立即下载