IBM X系列服务器通过sysmgmt接口查看日志

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:

    IBM服务器出现一些故障时。除了面板外,还可以通过sys mgmt接口来查看ibm服务器硬件日志。

IBM X系列服务器提供了Integrated Management Module(IMM)集成管理模块,可以比较方便的监控服务器健康状况,查看日志信息,还提供了一些配置管理功能。

    在IBM X系列服务器背板上有一个“SYS MGMT”接口,IMM的默认管理地址就是“192.168.70.125/24”用网线将此接口与笔记本连接起来,然后将笔记本的IP地址配置成“192.168.70.0/24”这个网段的地址,然后PING测试“192.168.70.125”,如果能通就OK了。,然后在IE地址栏输入“http://192.168.70.125”,然后出来以下界面:默认用户名:USERID密码:PASSWORD

 

输入用户名口令:USERID/PASSW0RD,注意是数字“0”不是英文字母“o”。

 

点“continue”,

 

在“system status”可以查看系统的健康状况,如果系统正常则显示绿色指示灯, 如果有错误则显示黄色灯,并会列出是什么错误。

 

 

“vitual light path”指示灯状态

 

 

这里是服务器日志信息模块,记录了错误日志,警告日志和信息日志信息,可以帮助工程师方便的定位故障。

 

在“network interfaces”里可以对网络接口进行配置,修改管理地址等操作。

 



下面是IBM对面板说明:

IBM服务器诊断面板

一、IBM X3650 M3诊断面板位置:

 

 

 

30ce44a8c39a13335f47d990e40992d9.png-wh_

1a4bdf7ca3e01c5bce2f1c0d231cc9ba.png-wh_

 

 

 

说明:

 

  电源控制按钮和供电指示灯按下此按钮可手动开启和关闭服务器,或唤醒处于省电

  状态下的服务器。供电指示灯的状态如下所示:

 

  A、熄灭:未接通交流电,或者电源或指示灯本身出现故障。

 

  B、快速闪烁(每秒四次):服务器已关闭,但未准备就绪,无法开启。电源控制按钮已禁用。服务器接通交流电源后大约三分钟,电源控制按钮便会激活。

 

  C、缓慢闪烁(每秒一次):服务器已关闭,并且已准备就绪,可以开启。您可以按电源控制按钮以开启服务器。

 

  D、点亮:服务器开启。

 

  E、逐渐变暗直至熄灭:服务器处于省电状态。要唤醒服务器,请按电源控制按钮或使用IMM Web 界面。

 

 

标注:如果该指示灯熄灭,并不表示服务器中不存在电流。该指示灯可能已烧毁。要切断服务器中的所有电流,必须从电源插座断开电源线。

 

 

  ●以太以太网图标指示灯:该指示灯点亮以太网图标。

 

  ●以太网活动指示灯: 如果这些指示灯中任意一个点亮,表示服务器正在向连接到对应

     于该指示灯的以太网端口的以太网LAN 发送信号,或正在接收来自该以太网LAN

     的信号。

 

  ● 信息指示灯:当该指示灯点亮时,表示发生了一般性事件。光通路诊断面板上的某

      个指示灯也会点亮,以帮助找出错误。

 

  ●系统错误指示灯:当该指示灯点亮时,表示发生了系统错误。光通路诊断面板上的

      某个指示灯也会点亮,以帮助找出错误。

 

  ●释放滑锁:将该滑锁滑向左侧可操作光通路诊断面板,该面板位于操作员信息面板

      的后面。

 

  ●定位器按钮和定位器指示灯:使用该指示灯可用肉眼在其他服务器中找到该服务

      器。它还可用于证明受信平台模块(Trusted Platform Module,TPM)的物理存在。

      按下此按钮可从本地开启或关闭该指示灯。可以使用IBM Systems Director 来远程

      点亮该指示灯。

 

 

 

 

 

 

二、IBM X3650 M3诊断面板显示信息。

 

 

465a2a97719a5f742d00e9c04ae2854d.png-wh_

 

 

指示灯

状态

问题

操作

BRD

 

亮灯

主板上发生错误。

 

1、检查主板上的指示灯,确定引起错误的组件。在下列情况下, BRD 指示灯可能会点亮:

  ●电池

   ●缺少PCI 转接卡组合件

   ● 稳压器发生故障

2、查看系统事件日志,获取有关错误的信息。

3、更换所有发生故障的可更换组件或安装缺少的可更换组件,如 电池或PCI 转接卡组合件。

4、如果稳压器发生故障,请更换主板。

CNFG

亮灯

发生硬件配置错误。


CPU

亮灯

当只有CPU 指示灯点亮时,才表示微处理器发生故障。

当CPU 指示灯和CNFG 指示灯都点亮时,表示微处理器配置无效。

1、确定CNFG 指示灯是否也点亮。如果CNFG 指示灯不亮,表示微处理器发生故障。

2、如果CNFG 指示灯点亮,表示微处理器配置无效。

DASD

亮灯

发生硬盘驱动器错误。硬盘驱动器发生故

障或缺失。

 

1、 检查硬盘驱动器上的指示灯以找出状态指示灯点亮的那个驱动 器,然后重新安装该硬盘驱动器。

2、重新安装硬盘驱动器底板。

3、如果该错误仍然存在,请按所示顺序更换以下组件:

     a、 更换硬盘驱动器。

     b、更换硬盘驱动器底板

FAN

亮灯

风扇发生故障,或者是运行过慢,或者是已卸下风扇。TEMP 指示灯可能也会点亮。

1、重新安装由主板上风扇接口附近点亮的指示灯所指示的故障风

扇。

2、更换由主板上风扇接口附近点亮的指示灯所指示的故障风扇。

LOG

亮灯

已将错误消息写入系统事件日志

查看IMM 系统事件日志和系统错误日志,获取有关错误的信息。更换错误日志中指出的所有组件。

MEM

亮灯

当只有MEM 指示灯点亮时,才表示发生了内存错误。

当MEM 指示灯和CNFG 指示灯都点亮时,表示内存配置无效。

 

1、确定CNFG 指示灯是否也点亮。如果是,请运行内存测试试验程序以确定问题。

a、 如果测试报告有内存错误发生,请更换由主板上点亮的指示灯所指示的故障DIMM。

b、如果测试报告内存配置无效,请将DIMM 重新插入具有受支持配置的插槽中。

2、如果CNFG 指示灯不亮,那么应该出现了以下某种情况:

a、 服务器未引导且DIMM 故障指示灯点亮。

b、查看系统事件日志(SEL)中是否存在PFA 日志事件。

c、重新安装DIMM。

d、如果问题仍然存在,请将DIMM 移到其他插槽中。

e、如果主板上与这个新DIMM 插槽对应的DIMM 指示灯点亮,请更换DIMM。

f、如果主板上与原DIMM 插槽对应的DIMM 指示灯点亮,请更换主板(仅限经过培训的技术服务人员)。

g、 服务器已引导,发生故障的DIMM 被禁用且其对应的指示灯点亮。

h、如果两个DIMM 对应的指示灯都点亮,请查看系统事件日志以找出有关其中一个DIMM 的PFA,然后更换该DIMM。否则,请同时更换这两个DIMM。

i、如果只有一个DIMM 对应的指示灯点亮,请更换该DIMM。

j、在服务器固件设置中重新启用DIMM 插槽。

NMI


发生不可屏蔽的中断,或按下了NMI 按钮。

查看系统事件日志,获取有关错误的信息。

OVER SPEC


由于某个电源通道上出现电源超负荷情况,所以关闭了服务器。电源功率超过最大额定值。


PCI


PCI 总线或主板上发生错误。发生故障的PCI 插槽旁的附加指示灯点亮。

 

1、检查PCI 插槽上的指示灯,确定导致错误的 组件。

2、查看系统事件日志,获取有关错误的信息。

3、如果无法通过指示灯和系统事件日志中的信息确定发生故障的适配器,请从发生故障的PCI 总线上逐个卸下适配器,并且每卸下一个适配器都重新   启动一次服务器。

PS


电源发生故障。

1、检查电源指示灯以了解是否有错误指示(交 流电源指示灯和直流电源指示 灯未同时点亮)。

2、确保发生故障的电源已正确安装到位。

3、更换发生故障的电源。

 

RAID


RAID卡发生故障

RAID卡有错误信息或RAID卡有硬件错误

SP


服务处理器(IMM)发生故障。

1、 切断服务器的电源;然后将服务器重新连接到电源并重新启动服务器。

2、 更新IMM 上的固件。

TEMP


系统温度已超出阈值级别。发生故障的风扇会导致TEMP 指示灯点亮。

 

1、查看错误日志,以确定在哪里测得温度过高情况。如果风扇发生故障,请进行更换。

2、确保室温不会太高。了解温度信息。

3、确保通风孔未堵塞。

 

 

 

  标注:

 

    REMIND 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。在提醒方式下,

  故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。



本文转自 sswqzx 51CTO博客,原文链接:http://blog.51cto.com/sswqzx/1975656

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
13天前
|
弹性计算 网络安全
阿里云国际OpenAPI多接口快速管理ECS服务器教程
阿里云国际OpenAPI多接口快速管理ECS服务器教程
|
23天前
|
存储 数据采集 分布式计算
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
34 1
|
23天前
|
分布式计算 资源调度 数据可视化
Hadoop-06-Hadoop集群 历史服务器配置 超详细 执行任务记录 JobHistoryServer MapReduce执行记录 日志聚合结果可视化查看
Hadoop-06-Hadoop集群 历史服务器配置 超详细 执行任务记录 JobHistoryServer MapReduce执行记录 日志聚合结果可视化查看
29 1
|
2月前
|
JavaScript 前端开发
vue配合axios连接express搭建的node服务器接口_简单案例
文章介绍了如何使用Express框架搭建一个简单的Node服务器,并使用Vue结合Axios进行前端开发和接口调用,同时讨论了开发过程中遇到的跨域问题及其解决方案。
42 0
vue配合axios连接express搭建的node服务器接口_简单案例
|
2月前
|
Java
日志框架log4j打印异常堆栈信息携带traceId,方便接口异常排查
日常项目运行日志,异常栈打印是不带traceId,导致排查问题查找异常栈很麻烦。
|
2月前
|
关系型数据库 MySQL 应用服务中间件
服务器端日志在哪里
服务器端日志在哪里
|
3月前
|
Java 应用服务中间件 HSF
Java应用结构规范问题之AllLoggers接口获取异常日志的Logger实例的问题如何解决
Java应用结构规范问题之AllLoggers接口获取异常日志的Logger实例的问题如何解决
|
3月前
|
Ubuntu Linux 测试技术
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
|
3月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
327 0
|
2天前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
16 3