icinga2通过check_hpasm监控HP服务器硬件报警

简介:

icinga2通过check_hpasm监控HP服务器硬件报警:


https://labs.consol.de/nagios/check_hpasm/#download


注:该工具也可用来直接监控Windows系统,Windows服务器在安装系统时默认会安装hp-snmp-agents组件



被监控服务器需安装hp-snmp-agents(及snmp)


# dpkg -i hp-snmp-agents_10.40-2909.34_amd64.deb

# /sbin/hpsnmpconfig

输入y (即使用已有/etc/snmp/snmpd.conf配置)



如果报下面错误,解决办法也简单(不一定通用,我遇到的是这么好的),执行/sbin/hpsnmpconfig,然后选择n,第1项随便输入2次一样的密码(commutiy那个),后面全默认回车,就好了



CRITICAL - snmpwalk returns no product name (cpqsinfo-mib), wrong device




redhat上可通过下面命令排错:


# snmpwalk -v 2c -c public 127.0.0.1  1.3.6.1.4.1.232


# /etc/init.d/hp-snmp-agents status  (确保是start状态)





# tar zxfv check_hpasm-4.7.5.4.tar.gz

# cd check_hpasm-4.7.5.4

# ./configure

# make

# make install


# cp -rv /usr/local/nagios/libexec/check_hpasm /usr/lib64/nagios/plugins/

# /usr/lib64/nagios/plugins/check_hpasm -H 10.0.0.3 -C public --perfdata=short






配置icinga2



# vi /etc/icinga2/conf.d/templates.conf 


object CheckCommand "HP" {

  import "plugin-check-command"

  command = [ PluginDir + "/check_hpasm" ]

  arguments = {

  "-H" = "$address$"

  "-C" = "$snmp$"

  "--perfdata" = "$perf$"

}

}


:wq


# vi /etc/icinga2/conf.d/services.conf 


apply Service "HP" {

  import "generic-service"

  check_command = "HP"

  vars.snmp="SPD.ubuntusrv#989"

  vars.perf="--perfdata=short"

  assign where host.address == "10.29.1.52" || host.address == "10.29.1.53"

}


:wq


# service icinga2 restart




也可借助被监控端的nrpe(不易受网络影响)


Ubuntu:


# vi /etc/nagios/nrpe.cfg


command[check_hpubt]=/usr/lib/nagios/plugins/check_hpasm -H 127.0.0.1 -C public


:wq


# service nagios-nrpe-server restart




Redhat:


# vi /etc/nagios/nrpe.cfg


command[check_hpubt]=sudo /usr/lib64/nagios/plugins/check_hpasm -H 127.0.0.1 -C public


:wq


# service nrpe restart



# vi /etc/sudoers


nagios  ALL=(ALL)       NOPASSWD:/usr/lib64/nagios/plugins/*


#Defaults    requiretty (默认未注释)


:wq




监控端icinga2配置略




附:


-v:显示服务器硬件详细信息

--hpasmcli /sbin/hpasmcli  显示硬盘健康情况

--snmpwalk /usr/bin/snmpwalk 结果同--hpasmcli

--blacklist daac  排除控制器加速器健康情况


https://labs.consol.de/nagios/check_hpasm/

本文转自linux博客51CTO博客,原文链接http://blog.51cto.com/yangzhiming/1943582如需转载请自行联系原作者

yangzhimingg
相关文章
|
3月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
3月前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
61 0
监控Linux服务器
|
4月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
540 0
|
4月前
|
监控 Linux 测试技术
|
7月前
|
运维 监控 Linux
提升系统稳定性:Linux服务器性能监控与故障排查实践深入理解与实践:持续集成在软件测试中的应用
【5月更文挑战第27天】在互联网服务日益增长的今天,保障Linux服务器的性能和稳定性对于企业运维至关重要。本文将详细探讨Linux服务器性能监控的工具选择、故障排查流程以及优化策略,旨在帮助运维人员快速定位问题并提升系统的整体运行效率。通过实际案例分析,我们将展示如何利用系统资源监控、日志分析和性能调优等手段,有效预防和解决服务器性能瓶颈。
|
3天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
2天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
10天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
11天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
14天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)