linux 性能监控工具——NAGIOS 和 OVO-阿里云开发者社区

开发者社区> 开发与运维> 正文

linux 性能监控工具——NAGIOS 和 OVO

简介: Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等。 Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。


功能介绍

Nagios 可以监控的功能有:  
      1、监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);
  2、监控主机资源(处理器负荷、磁盘利用率等);
  3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法;
  4、并行服务检查机制;
  5、具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;
  6、当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);
  7、可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;
  8、自动的日志滚动功能;
  9、可以支持并实现对主机冗余监控;
  10、可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;

系统需求

  Nagios所需要的运行条件是机器必须可以运行Linux(或是Unix变种)并且有C语言编译器。 你必须正确地配置TCP/IP协议栈以使大多数的服务检测可以通过网络得以进行。你需要但并非必须正确地配置Nagios里的CGIs程序,而一旦你要使用CGI程序时,你必须要安装以下这些软件...一个WEB服务(最好是Apache)

系统安装

  1.安装基础支持套件和添加用户
  nagios需要一些基础支持套件才能运行,如apache,gcc,glibc,gd库等。
  添加一个名为nagios的用户用以专门跑nagios
  设置密码
  添加nagcmd用户组,用以通过web页面提交外部控制命令
  将nagios用户加入nagcmd组
  将apache用户加入nagcmd组
  2.安装nagios
  这时nagios基本已经安装完成,默认安装后的配置文件用于启动nagios是没有问题的。
  修改nagiosadmin这行其中的邮件地址为你的email地址,以将报警邮件发到你的邮箱
  安装nagios的web接口
  设置登陆web界面时HTTP验证的账号密码
  3. 安装nagios-plugins
  nagios-plugins是nagios官方提供的一套插件程序,nagios监控主机的功能其实都是通过执行插件程序来实现的。
  4.安装nagios-snmp-plugins
  nagios-snmp-plugins是一套用Perl编写的通过SNMP方式监控主机插件程序
  配置这些插件的使用时需要配置cpan,CPAN是Comprehensive Perl Archive Network的缩写.。它是一个巨大的Perl软件收藏库,收集了大量有用的Perl模块(modules)及其相关的文件。这里主要是使用Perl-Net-SNMP模块。有两种方式安装:
  A)通过CPAN来安装
  B) 手工安装
  首先去官方网站下载以下几个模块
  Crypt::DES
  Digest::MD5
  Digest::SHA1
  Digest::HMAC
  Net::SNMP
  下载后对于每个模块依次按照下面的方式安装
  表示模块名,具体请按上面提到的模块替换
  注意:Net::SNMP模块必须在最后安装。至此Net::SNMP手动安装完毕
  执行nagios-snmp-plugins安装脚本,执行之后会将插件命令安装到/usr/local/nagios/libexec下
  5.其他设置
  至此nagios基本已经安装完毕,但这时还不能马上启动nagios,需要以下设置。
  将nagios添加到服务中
  设置服务为自启动
  检测nagios的配置是否正确,在后面配置nagios过程中我们为了检测配置的是否正确需要不断执行该命令来检查配置文件。
  #service nagios start 启动nagios
  需要注意的是,Centos默认打开了selinux并且运行于强制安全模式,这将导致在打开nagios的web界面时会出现Internet Server Error的错误。
  查看是否运行于强制模式,结果为1表示是
  更改selinux运行于宽容模式
  但是这个设置重启后就会失效,如需要重启后保持该设置需要修改/etc/sysconfig/selinux,将其中的SELINUX= enforcing更改为SELINUX= permissive并重启系统。当然你也可以改成disable禁用selinux。
  也可以不更改selinux的运行模式,解决办法为:
  6.实现MSN报警
  要实现MSN报警需要使用phpmsnclass,这是一个用php实现的msn机器人程序。
  下载phpmsnclass,此文件为7zip压缩格式,需要安装7z
  phpmsnclass需要php支持,安装php,这里为了方便就直接完成LAMP环境的安装
  安装mysql数据库,后面安装cacti需要
  由于安全原因请将mysql设置为只监听在127.0.0.1上,并删除mysql库中默认的除了外的所有用户,相关设置请见以前的关于postfix安装中的设置。
  安装php相关模块
  msn报警有2种方式,一种是直接使用php进行登陆验证发送消息,另外一个是以msn机器人的形式发送,将消息存储在目录内。这里采用第二种。
  下面把msnbot.php, config.php和msn.class.php拷贝到/var/spool/msnbot/
  这个机器人的工作原理是如果要发送消息,就调用php生成消息文件到
  /var/spool/msnbot/spool目录中,发送程序检查到该目录有新文件就会模拟msn登陆和发信将信息发送出去。
  在配置文件中设置MSN的账号和密码(以后报警通过这个MSN发出)
  加上执行权限
  在启动函数里执行的php文件前要加上php (php后有空格)
  启动MSN机器人
  下面发个消息测试一下
  如果成功接收到信息说明配置正确,此步骤到此结束,后面的能让Nagios使用MSN进行报警的功能需要到Nagios里设置了。
  如果需要支持离线消息即当你在离线状态下也能接收到机器人的信息,需要使用MSNP15协议,修改相关发信的php文件将声明新类的地方new MSN的第一个参数改为MSNP15


HP Openview OVO主机管理

HP Openview OVO(Openview Operation)能够对服务器故障进行集中监控,对服务器的进程、日志、性能进行集中管理,并对服务器的各项性能参数进行实时监控、分析和统计,同时提供面向应用的监控和根源故障定位,从而全面管理服务器及应用性能。

 

功能:

l      集成性好,提供统一的管理与监控

能够与网络管理平台NNM和各种智能插件进行集成,提供对网络、操作系统、数据库、中间件、企业应用进行全面管理。

主机事件管理:

•         对指定进程进行监控,如进程中止,可及时通知管理员,并自动重起进程;

•         设立多级告警机制,使CPU、内存等系统参数未超标时就提前告警;

•         对系统日志进行匹配设置,出现异常,及时通知管理员;

•         对应用程序日志进行匹配设置,可按出现次数、出现类型进行设置,对应用程序的潜在问题进行跟踪分析;

•         多种事件关联模板,简化故障处理。

主机性能管理:

•         采集主机系统的性能参数,汇总到管理端,形成历史记录;

•         设置系统性能阀值报警,及时通知管理员系统的运行状况;

•         根据系统资源利用的历史记录,提供数据化的决策支持;

•         提供系统性能、资源占用的实时监测工具,帮助管理员快速了解系统运行情况。

l      面向业务应用的监控

能够快速定位应用故障根源问题,减少故障修复时间。提供面向应用的监控视图,从应用角度定位根源故障;

l      安全信息传输

采用智能agent机制,实现主机的自治管理;并采用了https、dce-rps通讯机制保证信息传输安全,从而保证了主机的安全。

l      全中文支持

全中文监控界面和中文手册,方便用户使用。

 

特性:

•       提供集中的网络系统管理平台,实现针对企业环境的综合管理;并结合丰富的智能插件,对网络、操作系统、数据库、中间件、企业应用进行全面管理;

•       实现面向业务应用的监控,并通过根源问题发现功能,快速定位影响业务应用的故障点,减少故障修复时间;

•       提供多角色的管理环境,为监控人员提供便利的操作环境。

 

目标客户

•       所有需要对网络、系统、应用进行管理的用户(服务器数量大于10台,或有重要服务器需要管理的单位)

理想客户

•        网络系统环境复杂的用户,需要对大量网络设备、主机设备进行管理的用户;

•        惠普的Install base;拥有大量惠普服务器(HP-UX/TRU64、安腾)需要管理的用户;

•       NNM的用户,原来只对网络进行管理,现在需要扩展管理范围。

 

配置产品:

HP OpenView Operation & Performance Manager

HP OpenView Smart Plug-ins

HP OpenView Operation & Performance Agent

运行平台:

HP-UX、windows、Solaris

支持平台:

HP-UX, Solaris, AIX, Tru64, Linux,Windows etc.

 

项目成本

1.      软件

Windows平台:

描述

Prod Nbr

数量

总价(人民币)

HP Ops Mgr 7.x Windows Mgmt Svr SW LTU

B7405YA

1

 

HP Ops/Perf Agt Tier 1 Software LTU

B7420AA

30

 

HP Ops/Perf 7.5 Win S-CH Software Media

B7490YS

1

 

HP Ops Mgr 7.5 Win SCH Software Manual

B7491YS

1

 

 

 

总价:

 

UNIX平台:

描述

Prod Nbr

数量

总价(人民币)

HP Ops/Perf Mgr HP-UX Software LTU

B7405AA

1

 

HP Ops/Perf Agt Tier 1 Software LTU

B7420AA

30

 

HP Ops/Perf 8.x for HP-UX Software Media

B7490CA

1

 

HP Ops/Perf 8x UX SCH Software Manual

B7491CS

1

 

 

 

总价: 

 


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章