ibm服务器面板报警指示灯含意

简介:

EVENT LOG指示灯报警

有台IBM服务器前面的光通路面板开始亮起了小黄灯,推出这个小盒子一看,是EVENT LOG指示灯报警。一时不知道是什么原因,可能是日志错误,要进Configuration 去调一下,于是打800电话,硬件工程师听了我的问题后,说应该是日志文件满了,应清空一下,开机启动时,看到提示按F1进Configuration中把两个日志文件都清一下,我问怎么会满呢?他说只能存512条日志文件,多了就因覆盖不了前面的日志文件而报警,按他的方法在F1进入的 Configuration/Setup Utility中,选择POST Error Log选项后,直接回车选择Clear error logs清除所有的自检日志,同样选择System Error Log,直接回车选择Clear error logs清除所有的系统日志,一切OK(注:不同机型可以会略有不同,如3550只有system Error log选项,如果清除完后仍亮黄灯,建议断电几分钟再开机试试,如果问题还没有解决,那可能是硬件有问题了,请跟IBM售后联系!)。

PS2指示灯报警

IBM的解释是这个PS2不是PS2接口,而是服务器电源

DASD指示灯报警

7月21日下午检查机房设备时,发现一台IBM x3650服务器0号硬盘黄灯闪烁,前面板“!”红色警示灯亮,操作系统运行正常。打开“Light Path“面板,发现”DASD“灯亮,上网搜索了一下得知DASD(Direct Access Storage Device)灯亮是硬盘背板故障。这台服务器才运行一年多时间啊,不会这么快就坏吧。赶紧拨打IBM 800报修电话,描述完故障,客服人员做好记录后说呆会有工程师回电。可1个多小时过去了还没接到回电(当时心里不是很爽),于是又拨通了IBM报修热线,这回接电话的是另外一位工程师,了解故障情况后,答复:黄灯闪烁是硬盘在同步数据,同步完成会熄灭,DASD灯亮需作测试报告以进一步确定故障原因,有可能要对机器作微码升级,让我先做好数据备份,并将测试步骤以及所需测试软件发到我的邮箱。
下午快下班的时候,0号硬盘黄色故障灯果然熄灭恢复正常,但DASD故障灯仍亮,这样看来,0号硬盘本身应该没什么问题,故障可能真的出在硬盘背板上。不管怎么样,先将数据备份至另外一台服务器上。备完数据,按照IBM邮件里的处理步骤,进行DSA动态系统诊断,并将生成的诊断报告回复给IBM。
7月23日下午3:30,BE准时到现场。我询问到底是什么故障?答复升级微码后应该能解决问题,至于要不要更换硬盘背板还要看升级后的情况。接下去就是一系列的微码升级工作,包括主板BIOS、RAID卡等等。升级完成后,DASD故障灯果然熄灭,服务器看似恢复正常了。由于此前0号硬盘有报警,于是按Ctrl+A进入Array Controller对0号硬盘进行扫描检测,结果一切正常,排除了硬盘故障。硬盘背板是否正常,现在也不能下定论,工程师让我再观察几天,暂时不换备件。
下午2点,BE带着备件准时到场重新接回线缆、盖上机盖、开机、进入系统,一切常,                
              故障排除了,也留下许多疑问。如果确实是硬盘背板问题,为什么微码升级过后就恢复正常了?如果背板是好的只是单纯微码升级问题,为什么故障在机器运行一年多后才出现?这些疑问BE没有当场给我答复,让人纳闷。希望有同样经历的朋友互相交流!

 

ps   指示灯:当此指示灯发亮时,表明电源2 出现故障。

temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。

fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。风扇发生故障还会导致over temp 指示灯发亮。

link指示灯:当此指示灯发亮时,网卡出现故障。

vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。

cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。

pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。

mem 指示灯:当此指示灯发亮时,表明发生内存错误。

dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。

nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。

sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。

brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。

log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。

cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误

raid 指示灯:当此指示灯发亮时,表明阵列卡故障。

over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。

remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。 
















本文转自pimg200551CTO博客,原文链接:http://blog.51cto.com/pimg2005/1074616 ,如需转载请自行联系原作者


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
19天前
|
网络协议 网络架构 Windows
【Windows】MCSM面板搭建Mycraft服务器,实现公网远程联机
【Windows】MCSM面板搭建Mycraft服务器,实现公网远程联机
59 0
|
1月前
|
网络协议 Linux 网络安全
如何公网远程访问Linux AMH服务器管理面板【内网穿透】
如何公网远程访问Linux AMH服务器管理面板【内网穿透】
29 0
如何公网远程访问Linux AMH服务器管理面板【内网穿透】
|
2月前
|
运维 数据挖掘 数据库
服务器数据恢复-服务器raid5硬盘指示灯变红的数据恢复案例
一台服务器上3块磁盘组建了一组raid5磁盘阵列。服务器运行过程中有一块硬盘的指示灯变为红色,raid5磁盘阵列出现故障,服务器上层操作系统的分区无法识别。
服务器数据恢复-服务器raid5硬盘指示灯变红的数据恢复案例
|
2月前
|
运维 Linux 数据库管理
centos有哪些服务器管理面板
centos有哪些服务器管理面板
43 0
|
3月前
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
4月前
|
Ubuntu 关系型数据库 Linux
Linux系统之部署Ajenti服务器管理面板
Linux系统之部署Ajenti服务器管理面板
56 0
|
4月前
|
运维 数据挖掘 Windows
服务器数据恢复-服务器硬盘指示灯黄色灯常亮的数据恢复案例
某品牌机架式服务器,7块SAS接口硬盘搭建raid5磁盘阵列,Windows操作系统。 服务器上有一块硬盘指示灯的黄灯常亮,随后这块硬盘被raid5阵列踢出,raid阵列崩溃。
|
4月前
|
存储 数据挖掘
服务器数据恢复-IBM Storwize V7000存储数据恢复案例
服务器数据恢复环境: P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。 服务器故障: 存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40%左右时,阵列柜中的另一块磁盘也出现问题,数据同步中断,逻辑盘无法挂接到小型机上,业务中断。存储的管理界面显示2块硬盘故障脱机。 阵列柜中的磁盘共组建了2组Mdisk,加到一个pool中。现在主要数据pool无法加载,有3个通用卷无法挂载。
|
5月前
|
Java Linux
百度搜索:蓝易云【Linux搭建我的世界MC服务器 - MCSM面板教程。】
请注意,上述教程提供了基本的步骤来搭建和管理Minecraft服务器使用MCSM面板。根据您的特定需求和服务器环境,可能需要进行额外的配置和调整。
94 0
|
7月前
|
运维 监控 安全
《2023 最全热门服务器面板测评推荐》
接下来将从运维面板的作用和发展方向及发展历程等方面,对以往常见的一些面板,以及新一代面板进行简单的分析,为大家在运维面板的选择方面提供更多的参考。
《2023 最全热门服务器面板测评推荐》

相关产品

  • 云迁移中心