Nagios监控DELL服务器硬件

简介:

Nagios监控DELL服务器硬件

1、监控插件介绍

      通过Nagios插件check_openmanage基于DELL Openmanage Server Administrator (OMSA)

      DELL服务器硬件(物理磁盘、逻辑磁盘、电源、电源、风扇转速、温度、CPU、内存、BIOSFamware版本等硬件),此插件支持WinLinux系统。

      官方测试成功的DELL服务器型号:

      1750, 1800, 1850, 1950, 1955, 2600, 2650, 2800, 2850, 2900, 2950, 6650, 6950, 750, 850, M600, M610, R510, R610, R710, T710, R805, R815, R900, R910

      本文测试使用的R710,基本主流的DELL服务器都支持。

 

      关于插件详见: 

 http://folk.uio.no/trondham/software/check_openmanage.html

  

      监控方式本:本地插件或远程SNMP:

       

 wKiom1RsCIPAsVQvAAFziBPjcLg001.jpg

 

2、被监控机须安装DELL OMSA 


     2.1,安装前的设置
              wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

     2.2,安装OMSA
              yum install srvadmin-all -y

 


     2.3,【可选】安装firmware-tools 用来管理BIOSfirmware版本更新
             yum install dell_ft_install
             


     2.4,【可选】更新BIOSfirmware版本
             比较可用更新版本
             update_firmware

             安装任何可用更新
             update_firmware --yes

             更新后,需要重启服务器。

   

 

       2.5  配置OMSA服务开机自动:

 

          /opt/dell/srvadmin/sbin/srvadmin-services.sh enable

 

       2.6启动srvadmin服务

            /opt/dell/srvadmin/sbin/srvadmin-services.sh start

    

       2.7 查看omsa的服务状态:

 

          /opt/dell/srvadmin/sbin/srvadmin-services.sh status          dell_rbu(module) is running          ipmidriver is running          dsm_sa_datamgrd(pid 1331 1197) is running          dsm_sa_eventmgrd(pid 1381) is running          dsm_sa_snmpd(pid 1440) is running          dsm_om_shrsvcd(pid 1508) is running...          dsm_om_connsvcd(pid  1562) is running...

 

 

     2.8,重新启动SNMP服务


           /etc/init.d/snmpd restart

           注意:snmpd.conf文件中要包含下面的内容

           # Allow Systems Management Data Engine SNMP to connect to snmpd using SMUX

           smuxpeer .1.3.6.1.4.1.674.10892.1

 

 

            

3、在nagios上安装插件


      下载 check_openmanage-3.7.11.tar.gz 后解压,将解压后的目录拷贝到 /usr/local/nagios/libexec/ 目录即可。

 

4、插件命令使用示例

      在 commands.cfg 文件里增加下面的内容:

      ##############################  dell_OMSA  ########################

      define command {

             command_name                check_dell_hardware

             command_line                /usr/local/nagios/libexec/check_openmanage/check_openmanage -H $HOSTADDRESS$ -C sou_shi  -t 100

       }

 

       在被监控的机器配置文件中增加以下内容:

       

       ##########################  dell_OMSA  ##################################

       define service {

                use                                  dell-service

                host_name                     x.x.x.x.

                service_description         check_dell_hardware

                check_command             check_dell_hardware

        }

 

 5、监控效果图如下:

       wKiom1RsCLDiapVUAADQyUfOqnM046.jpg

 

 6、简单介绍OMSA平台管理服务器

       这是一个基于web程序管理DELL服务器,安装完毕OMSA自动启用TCP端口1311
       访问方式:https://服务器IP1311 ,使用系统账户密码登录,界面类似于iDrac
       功能方面:可以配置BIOS、控制电源、硬件监控、存储管理配置、软件信息、iDrac管理、系统网络管理等,功能比较强,当然是基于操作系统和OMSA







      本文转自crazy_charles 51CTO博客,原文链接: http://blog.51cto.com/douya/1579431 ,如需转载请自行联系原作者

相关文章
|
2月前
|
存储 监控 Linux
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
53 0
|
5月前
|
存储 安全 Linux
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
135 4
Dell OpenManage Enterprise 4.4 - Dell 服务器、存储和网络设备集中管理软件
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
9月前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
11月前
|
存储 Unix Linux
服务器数据恢复—DELL EqualLogic PS6100系列存储简介及发生故障后的处理方案
DELL EqualLogic PS6100系列存储采用虚拟ISCSI SAN阵列,支持VMware、Solaris、Linux、Mac、HP-UX、AIX操作系统,提供全套企业级数据保护和管理功能,具有可扩展性和容错功能。
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
278 0
监控Linux服务器
|
1月前
|
存储 缓存 数据挖掘
阿里云目前最便宜云服务器介绍:38元、99元、199元性能,选购攻略参考
轻量应用服务器2核2G峰值200M带宽38元1年;云服务器经济型e实例2核2G3M带宽99元1年;云服务器通用算力型u1实例2核4G5M带宽199元1年。对于还未使用过阿里云服务器的用户来说,大家也不免有些疑虑,这些云服务器性能究竟如何?它们适用于哪些场景?能否满足自己的使用需求呢?接下来,本文将为您全方位介绍这几款云服务器,以供您了解及选择参考。
|
2月前
|
网络安全 云计算
如何设置阿里云轻量应用服务器镜像?
本文介绍了在阿里云轻量应用服务器上创建与配置镜像的详细步骤。镜像是一种特殊的文件系统映射,可用于快速克隆服务器配置。内容涵盖准备条件、登录控制台、创建实例、生成镜像、下载与设置镜像,以及如何使用镜像启动新实例。适合希望提升服务器部署效率的用户参考。
|
1月前
|
弹性计算 Devops Shell
用阿里云 DevOps Flow 实现 ECS 部署自动化:从准备到落地的完整指南
阿里云 DevOps Flow 是一款助力开发者实现自动化部署的高效工具,支持代码流水线构建、测试与部署至ECS实例,显著提升交付效率与稳定性。本文详解如何通过 Flow 自动部署 Bash 脚本至 ECS,涵盖环境准备、流水线搭建、源码接入、部署流程设计及结果验证,助你快速上手云上自动化运维。
143 0

热门文章

最新文章