icinga2通过check_hpasm监控HP服务器硬件报警

简介:

icinga2通过check_hpasm监控HP服务器硬件报警:


https://labs.consol.de/nagios/check_hpasm/#download


注:该工具也可用来直接监控Windows系统,Windows服务器在安装系统时默认会安装hp-snmp-agents组件



被监控服务器需安装hp-snmp-agents(及snmp)


# dpkg -i hp-snmp-agents_10.40-2909.34_amd64.deb

# /sbin/hpsnmpconfig

输入y (即使用已有/etc/snmp/snmpd.conf配置)



如果报下面错误,解决办法也简单(不一定通用,我遇到的是这么好的),执行/sbin/hpsnmpconfig,然后选择n,第1项随便输入2次一样的密码(commutiy那个),后面全默认回车,就好了



CRITICAL - snmpwalk returns no product name (cpqsinfo-mib), wrong device




redhat上可通过下面命令排错:


# snmpwalk -v 2c -c public 127.0.0.1  1.3.6.1.4.1.232


# /etc/init.d/hp-snmp-agents status  (确保是start状态)





# tar zxfv check_hpasm-4.7.5.4.tar.gz

# cd check_hpasm-4.7.5.4

# ./configure

# make

# make install


# cp -rv /usr/local/nagios/libexec/check_hpasm /usr/lib64/nagios/plugins/

# /usr/lib64/nagios/plugins/check_hpasm -H 10.0.0.3 -C public --perfdata=short






配置icinga2



# vi /etc/icinga2/conf.d/templates.conf 


object CheckCommand "HP" {

  import "plugin-check-command"

  command = [ PluginDir + "/check_hpasm" ]

  arguments = {

  "-H" = "$address$"

  "-C" = "$snmp$"

  "--perfdata" = "$perf$"

}

}


:wq


# vi /etc/icinga2/conf.d/services.conf 


apply Service "HP" {

  import "generic-service"

  check_command = "HP"

  vars.snmp="SPD.ubuntusrv#989"

  vars.perf="--perfdata=short"

  assign where host.address == "10.29.1.52" || host.address == "10.29.1.53"

}


:wq


# service icinga2 restart




也可借助被监控端的nrpe(不易受网络影响)


Ubuntu:


# vi /etc/nagios/nrpe.cfg


command[check_hpubt]=/usr/lib/nagios/plugins/check_hpasm -H 127.0.0.1 -C public


:wq


# service nagios-nrpe-server restart




Redhat:


# vi /etc/nagios/nrpe.cfg


command[check_hpubt]=sudo /usr/lib64/nagios/plugins/check_hpasm -H 127.0.0.1 -C public


:wq


# service nrpe restart



# vi /etc/sudoers


nagios  ALL=(ALL)       NOPASSWD:/usr/lib64/nagios/plugins/*


#Defaults    requiretty (默认未注释)


:wq




监控端icinga2配置略




附:


-v:显示服务器硬件详细信息

--hpasmcli /sbin/hpasmcli  显示硬盘健康情况

--snmpwalk /usr/bin/snmpwalk 结果同--hpasmcli

--blacklist daac  排除控制器加速器健康情况


https://labs.consol.de/nagios/check_hpasm/

本文转自linux博客51CTO博客,原文链接http://blog.51cto.com/yangzhiming/1943582如需转载请自行联系原作者

yangzhimingg
相关文章
|
1月前
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
2月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
2月前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
51 0
监控Linux服务器
|
3月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
421 0
|
3月前
|
监控 Linux 测试技术
|
9天前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
|
11天前
|
存储 分布式计算 固态存储
阿里云2核16G、4核32G、8核64G配置云服务器租用收费标准与活动价格参考
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择。目前2核16G配置按量收费最低收费标准为0.54元/小时,按月租用标准收费标准为260.44元/1个月。4核32G配置的阿里云服务器按量收费标准最低为1.08元/小时,按月租用标准收费标准为520.88元/1个月。8核64G配置的阿里云服务器按量收费标准最低为2.17元/小时,按月租用标准收费标准为1041.77元/1个月。本文介绍这些配置的最新租用收费标准与活动价格情况,以供参考。
|
9天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
|
17天前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
54 9
|
14天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。