Nagios监控DELL服务器硬件

简介:

Nagios监控DELL服务器硬件

1、监控插件介绍

      通过Nagios插件check_openmanage基于DELL Openmanage Server Administrator (OMSA)

      DELL服务器硬件(物理磁盘、逻辑磁盘、电源、电源、风扇转速、温度、CPU、内存、BIOSFamware版本等硬件),此插件支持WinLinux系统。

      官方测试成功的DELL服务器型号:

      1750, 1800, 1850, 1950, 1955, 2600, 2650, 2800, 2850, 2900, 2950, 6650, 6950, 750, 850, M600, M610, R510, R610, R710, T710, R805, R815, R900, R910

      本文测试使用的R710,基本主流的DELL服务器都支持。

 

      关于插件详见: 

 http://folk.uio.no/trondham/software/check_openmanage.html

  

      监控方式本:本地插件或远程SNMP:

       

 wKiom1RsCIPAsVQvAAFziBPjcLg001.jpg

 

2、被监控机须安装DELL OMSA 


     2.1,安装前的设置
              wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

     2.2,安装OMSA
              yum install srvadmin-all -y

 


     2.3,【可选】安装firmware-tools 用来管理BIOSfirmware版本更新
             yum install dell_ft_install
             


     2.4,【可选】更新BIOSfirmware版本
             比较可用更新版本
             update_firmware

             安装任何可用更新
             update_firmware --yes

             更新后,需要重启服务器。

   

 

       2.5  配置OMSA服务开机自动:

 

          /opt/dell/srvadmin/sbin/srvadmin-services.sh enable

 

       2.6启动srvadmin服务

            /opt/dell/srvadmin/sbin/srvadmin-services.sh start

    

       2.7 查看omsa的服务状态:

 

          /opt/dell/srvadmin/sbin/srvadmin-services.sh status          dell_rbu(module) is running          ipmidriver is running          dsm_sa_datamgrd(pid 1331 1197) is running          dsm_sa_eventmgrd(pid 1381) is running          dsm_sa_snmpd(pid 1440) is running          dsm_om_shrsvcd(pid 1508) is running...          dsm_om_connsvcd(pid  1562) is running...

 

 

     2.8,重新启动SNMP服务


           /etc/init.d/snmpd restart

           注意:snmpd.conf文件中要包含下面的内容

           # Allow Systems Management Data Engine SNMP to connect to snmpd using SMUX

           smuxpeer .1.3.6.1.4.1.674.10892.1

 

 

            

3、在nagios上安装插件


      下载 check_openmanage-3.7.11.tar.gz 后解压,将解压后的目录拷贝到 /usr/local/nagios/libexec/ 目录即可。

 

4、插件命令使用示例

      在 commands.cfg 文件里增加下面的内容:

      ##############################  dell_OMSA  ########################

      define command {

             command_name                check_dell_hardware

             command_line                /usr/local/nagios/libexec/check_openmanage/check_openmanage -H $HOSTADDRESS$ -C sou_shi  -t 100

       }

 

       在被监控的机器配置文件中增加以下内容:

       

       ##########################  dell_OMSA  ##################################

       define service {

                use                                  dell-service

                host_name                     x.x.x.x.

                service_description         check_dell_hardware

                check_command             check_dell_hardware

        }

 

 5、监控效果图如下:

       wKiom1RsCLDiapVUAADQyUfOqnM046.jpg

 

 6、简单介绍OMSA平台管理服务器

       这是一个基于web程序管理DELL服务器,安装完毕OMSA自动启用TCP端口1311
       访问方式:https://服务器IP1311 ,使用系统账户密码登录,界面类似于iDrac
       功能方面:可以配置BIOS、控制电源、硬件监控、存储管理配置、软件信息、iDrac管理、系统网络管理等,功能比较强,当然是基于操作系统和OMSA







      本文转自crazy_charles 51CTO博客,原文链接: http://blog.51cto.com/douya/1579431 ,如需转载请自行联系原作者

相关文章
|
2月前
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
1月前
|
运维 监控 Unix
服务器监控软件Nagios
【10月更文挑战第19天】
45 2
|
3月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
3月前
|
监控 应用服务中间件
Nagios 服务器 Nrpe 配置
Nagios服务器需安装NRPE并定义监控命令于`command.cfg`中。示例配置如下:`check_nrpe -H $HOSTADDRESS$ -c $ARG1$`。客户端配置文件如`192.168.149.128.cfg`可引用NRPE配置的命令,如`check_nrpe!check_load`以监控负载。监控HTTP关键词使用`check_http`命令加参数,如`-I`指定IP,`-u`指定URL,`-s`指定关键词,可在`command.cfg`中定义如`check_http_word`命令,并在主机配置文件中引用。
68 13
|
3月前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
61 0
监控Linux服务器
|
4月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
523 0
|
3天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
4天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
7天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)
|
24天前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
45 6