六、日常设备维护检查1. 系统及网络状态的监测
主要监测以下几个方面:
v 面板指示灯
v 硬件在系统中的配置
v 文件系统
v 日志文件
2. 面板指示灯的监测
v 液晶显示屏
如果系统启动时或运行中down机时,液晶显示停在某一非正常运行状态,如 FLT XXXX,或 INIT XXX,则表明可能有硬件错误 ( CONSOLE 上出现ERROR)
v 前面板指示灯有:
a、磁带机驱动器、
b、光盘驱动器状态灯。
c、电源指示灯、
d、软(硬)驱动器指示灯。
一般情况下,黄色指示灯不停闪烁,无法终止时表明可能有硬件故障。此时应尽快联系HP硬件工程师帮助诊断 并维修。
v 后面板指示灯有:
a、F/W SCSI接口卡终结器(TERM POWER-F/W DIFF SCSI)指示灯
ON:表示F/W SCSI卡配置的终结器工作正常
OFF:表示F/W SCSI卡配置的终结器保险丝损坏
b、SCSI接口卡自检灯(Self-Test LED)当硬件自检时灯闪烁,自检完成 (超过5秒钟)后灯灭,表示工作正常。当自检完成后灯仍亮则说明该卡有故障。
c、调制解调器:
Transmit灯: 有信号发出时发光
Receive灯: 接收信号时发光
d、网络接口卡:
K系列(如K210、K410) Transmit灯: 信号发出时发光
Link Beat灯: 接收信号时发光
D系列(如D350) Link Beat灯:
ON:表示网络通信正常
OFF: 网络通信可能有故障
e、HP服务支持MODEM各LED的含义:
TR: 传输状态 CD: 载波检测
OH: 在线连接 RD: 读入信号
AA: 自动应答 SD: 发出信号
3. 在系统中查找设备配置
# dmesg
内存
CPU
外设(I/O接口卡,磁盘设备etc.)
root,swap,dump设备分配信息
注:dmesg是从Kernel缓冲区里读出的数据
# ioscan -fn(扫描实际硬件)
# ioscan -kf(扫描Kernel I/O system)
内存
CPU
外设(I/O接口卡,磁盘设备etc.)
4. 检查文件系统使用情况
#bdf
Filesystem kbytes used avail %used Mounted on
/dev/vg00/lvol1 67733 35561 25398 58% /
/dev/vg01/lvol1 20480 11675 8247 59% /home
各列的含义:
Filesystem:文件系统名
kbytes:字节数,以k为单位
used:已使用空间
avail:尚可使用空间
%used: 已使用空间占本文件系统全部空间比率。
Mounted on: 安装目录
在下列两种情况下,系统管理员应考虑做必要的文件清理工作:
v %used达到90%以上时
v avail显示字节数较小时(如小于10K)
5. 日志文件的监测
文件名 文件内容 监测方法
/etc/rc.log /etc/rc 运行记录 用读取文本文件的方法
/var/adm/syslog/syslog.log 一般系统日志 注意提示信息及对应的
/var/adm/sw/*.log 软件安装日志 日期,分析发生的相关
/var/adm/wtmp 用户登录信息 原因
/var/adm/btmp 用户登录失败信息
/var/sam/log/samlog SAM日志
/var/spool/mqueue/syslog sendmail日志
/etc/shutdownlog 关机(shutdown)信息
-------------------------------------------------------------------------------------------
/usr/adm/diag/LOGxxx 用工具查看
/var/adm/nettl.LOG* 网络日志 由HP工程师负责
/var/adm/crash core dump文件
6. 文件清理1) 日志文件:
系统管理员的一个主要工作就是周期性清除某些系统日志文件。
这些日志文件包括:
/var/adm/wtmp 所有的注册信息
/var/adm/btmp 所有的注册不成功的信息
/var/adm/sulog 执行su的情况
/var/adm/crash/vmunix.0 core dump文件(在HP工程师分析后再删除)
/var/adm/crash/core.0 core dump文件(在HP工程师分析后再删除)
/var/adm/syslog/mail.log 电子邮件方面的信息
/var/adm/syslog/syslog.log 系统一般信息,如配置改变情况等。
/var/adm/sw/swinstalllog 软件安装时产生的信息
/var/adm/sw/swremove.log 卸载软件时产生的信息
删除方法为:
# > 文件名 或
# cat /dev/null > 文件名
注意: 清空文件前应确认文件是否无用
2) 文件清理
v core文件
# find / -name core -exec rm {}
v 其他大文件
其查找方法为:
# find / -name (-size +n) -print
n=需查找文件大小bytes/ 512bytes
# du -s *
其删除方法为:
# rm 文件名
注意: 清空文件前应确认文件是否无用
3) 其他系统管理员可能用得上的小窍门
A) 超级用户忘了密码怎么办?
a、重起机器,自检完成后,会出现这一行“To discontinue, press any key in 10 seconds ”,这时你按任意键,系统会中止启动,进入 Main Menu.
b、键入“ bo ”, 在系统询问“ Interact with IPL (Y or N?)?”,输入 “y”。
c、在提示符ISL> 后, 输入“ hpux - is ”, 系统进入单用户状态。
d、键入“ passwd ”, 然后输入新的密码。
e、键入“ reboot ”, 恢复系统正常运行。
B) 怎样通过联机帮助学会不懂的命令?
HP-UX提供了一个联机命令“man”,该命令用于帮助用户了解 某个HP-UX命令的使用方法、命令的作用等等。
如下例,显示了HP-UX命令 who 的联机帮助信息:
#man who
who(1) who(1)
NAME
who - who is on the system
SYNOPSIS
who [-muTlHqpdbrtasAR] [file]
who am i
who am I
DESCRIPTION
The who command can list the user's name, terminal line, login time, elapsed time since input activity occurred on the line, the user'shost name, and the process-ID of the command interpreter (shell) for each current system user. It examines the /etc/utmp file to obtain its information. If file is given, that file is examined. Usually, file is /var/adm/wtmp, which contains a history of all of the logins since the file was last created. The who command with the am i or am I option identifies the invoking user.
C)、查看系统中安装了什么软件
查看系统中所安装的软件,我们可以用命令:
# swlist
D)、硬件路径(Hardware Path)的含义
硬件路径是指主机对其SPU与外设(I/O)进行管理的一种标识,是对设备总线结构与地址设置路径结构的标识,以便于确定硬件与诊断故障。不同设备的硬件路径不能相同,否则会造成中断冲突。不同机型由于总线结构不同,同类设备的硬件路径大相径庭。一般原则是,每次总线转换必须有一个反斜扛将上下级总线分隔开。
例如: 8/16/5.6.0 8--- 第一级总线 16--- 第二级总线
5--- 第三级总线卡号 6--- 地 址
0--- 相应地址下第一个设备
E)、CodeWord的作用及怎样申请?
CodeWord是HP公司用来进行用户权益及软件版权保护的一种方法。当用户购买了HP公司的软件产品时,会得到若干张CD介质-Applica-tion盘。在Application盘中,包含有未加密的软件和加过密的软件。加密软件是用户另外付款购买的软件,为保证用户权益及软件版权得到保护,HP只将解密用的密钥-Code Word,交给购买软件的最终用户。
当用户收到 Application 盘的同时,还会收到一个用红色字 “IMPORTANT”标注的大信封。信封内装的是CodeWord的申请表。申请时将操作系统介质的CD盘号和Application盘(每一张)的盘号填在申请表中,再将如何接收CodeWord的方式(FAX或E-mail)填进表中;然后,将申请表用传真发到申请表上指定的传真机。一般情况下,第二天即可收到CodeWord。
在收到的CodeWord表中,会标明哪个CodeWord对应哪个软件并且该软件在哪一张 Application 盘上。安装软件时将 Application 盘放入CD-ROM驱动器;执行swinstall命令;在Action菜单里,选Input New Code Word项,输入CodeWord。完成后,在可安装的软件窗口中 就可看到解密后的软件;选中该软件,然后进行安装。
本文转自glying 51CTO博客,原文链接:http://blog.51cto.com/liying/967750,如需转载请自行联系原作者