安装及测试步骤:
▪ 硬件安装过程
硬件安装包括以下过程:
a) 3台服务器拆箱
b) 液晶屏/键盘鼠标拆箱
c) HMC开箱并验货
d) HMC安装
e) 3台服务器上架
f) 服务器电源线、主控台连线连接
▪ 软件安装
软件安装包括以下过程:
a) 操作系统安装
基本操作系统安装:
1. 在光盘驱动器中放入AIX操作系统的第一张光盘
2. 重新启动计算机
3. 当屏幕上出现键盘图标时,在主控台的键盘上按“F5”,让计算机从光盘直接启动。
4. 当屏幕上出现“Please define the system console”时,输入“F1”和回车,确定主控台。
5. 当屏幕上再次提示时,按“1”和回车,确定安装过程中使用英语作为安装语言。
6. 当“Welcome to the Base Operating System Installation and Maintenance”屏幕出现时,选择选项“2. Change/show Installation Settings and Install” “1. System Settings” “1. New and Complete Overwrite” “99”确定安装方式为全新安装。
确认安装目的硬盘为“1. hdisk0”后在选择“0”继续设置过程。(在本系统安装过程中必须选择hdisk0安装操作系统,如果安装在其他硬盘上,将导致系统无法启动。)
在“installation and Settings”环境中确认设置后,选择“0”正式开始系统安装过程。
7. 在计算机安装操作系统的过程中,会提示当前正在操作的步骤内容,已经安装的时间,安装过程已完成的百分比。基本操作系统安装完毕后,计算机会自动重新启动。
8. 当新装的操作系统第一次启动时,会在出现登录界面之前先进入installation assistant环境。
此时可以进行下列操作
Set Date and Time
Set root Password
Set Installation Device
Configure Network Communications
Manage System Storage and Paging Space (rootvg)
Manage Language Environment
Create Users
Define Printers
Import Existing Volume Groups
Install Software Applications
用户可以在此对以上每一项做相应设置,以上项目也可以在进入系统之后再对相关内容进行一一设置。
操作系统其他部分安装:
操作系统的其他内容可以根据客户的实际情况而安装特定部分,以节省系统资源和硬盘空间。我们会为客户安装以下两部分的软件包:server和app-dev。安装方法如下:
使用命令:smitty easy_install 在INPUT device/directory for software中输入光驱:/dev/cd0 回车选择App-Dev 回车进入安装界面 回车开始安装。并以相同的方法安装server软件包。
b) man的安装
根据用户的需要,我们安装base document, 安装方法如下:
使用命令:smitty install_latest 在INPUT device/directory for software中输入光驱:/dev/cd0 回车,将SOFTWARE to install设定为[_all_latest] 回车开始安装。
c) 操作系统补丁软件安装:
把AIX操作系统update光盘放入光盘驱动器中
使用命令:smitty update_all
选择安装设备“/dev/cd0”后进行安装。
d) 系统设置:
网卡设置
使用命令:smitty mktcpip
选择:“en0”。(因为6H1上有多块网卡,所以统一选en0这块百兆网卡)
修改“HOSTNAME”选项的值为:“SAP01”, “SAP02”和“SAP03”;修改“Internet ADDRESS (dotted decimal)”选项的值为:“192.168.1.20”, “192.168.1.22”和“192.168.1.24”;修改“Network MASK (dotted decimal)”选项的值为:“255.255.255.0”;修改“Default GATEWAY Address”选项的值为:“192.168.1.254”;修改“START Now”选项的值为:“Yes”。
e) Paging Space的划分
/dev/hd6为Paging Space区,大小为内存大小或内存的2倍。
f) 对rootvg做镜像
rootvg:
PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION
hdisk0 active 542 0 00..00..00..00..00
hdisk1 active 542 0 00..00..00..00..00
其中,hdisk0和hdisk1互为镜像。
▪ 日常注意事项:
a) 系统检查
硬件状态
在硬件系统的多个部位都有指示灯显示硬件系统状态。
系统状态指示灯:正常状态下该灯应该没有显示。
液晶显示屏:正常状态下显示屏应该没有显示。
硬盘指示灯:正常状态下硬盘指示灯为绿色。
b) 系统日志
经常使用errpt命令检查报错信息(error log)查看是否有重大错误产生,作到防患于未然。
使用命令errpt得到的输出信息类似于:
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION 2BFA76F6 1128173301 T S SYSPROC SYSTEM SHUTDOWN BY USER 9DBCFDEE 1129163701 T O errdemon ERROR LOGGING TURNED ON 192AC071 1128173101 T O errdemon ERROR LOGGING TURNED OFF E18E984F 1122122301 P S SRC SOFTWARE PROGRAM ERROR 2BFA76F6 1109152401 T S SYSPROC SYSTEM SHUTDOWN BY USER 9DBCFDEE 1116101701 T O errdemon ERROR LOGGING TURNED ON 192AC071 1109152301 T O errdemon ERROR LOGGING TURNED OFF
在以上的命令输出中我们可以得到系统的相关信息,其中:
IDENTIFIER列是系统给每个出错信息的代码
TIMESTAMP列是该出错信息产生的时间
T列是出错信息的出错类型的描述,可能的类型是TEMP,PERF,INFO等
C列是出错源类型的描述,可能是HARDWARE,SOFTWARE,OPERATION等。
RESOURCE_NAME列是出错源的名称
DESCRIPTION列是对每个出错信息的简单描述
如果出错信息的T列是P,C列是H则表明是永久性的硬件故障,需要查看其详细信息。
由此命令可到出错信息的基本信息,如果想得到某个出错信息的更详细的描述,可以使用命令:errpt –aj IDENTIFIER_number,即可对某一条出错信息查询他的详细信息,并对引起该错误的出错源进行控制。
c) 系统mail
系统会经常把系统提示信息和出错信息mail给root用户,所以作为root用户应经常使用mail命令检查信箱是否有重要的系统提示或报错信息,对于已经处理的root用户mail,及时清理对系统管理员来说是非常重要的日常工作。
使用命令:mail检查root用户信箱中的内容,可得到类似于以下的信息:
Mail [5.2 UCB] [AIX 4.1] Type ? for help. "//mbox": 2 messages > 1 test1 Sun Nov 25 09:38 13/288 "hello" 2 root Fri Nov 23 16:31 15/500 ?
从以上可看到,当前在root用户中有两封mail,在?后键入mail前的序列号可察看具体的mail信息。并检查系统情况,在排除故障后及时清除root mail。
d) 容量监控
管理员应经常查看系统的使用情况,使用df命令查看文件系统的容量是否够用,是否需要添加空间;
例如:使用命令:df –k可得到类似以下的信息
Filesystem 1024-blocks Free %Used Iused %Iused Mounted on /dev/hd4 8192 3020 64% 1024 25% / /dev/hd2 909312 50456 95% 33856 15% /usr /dev/hd9var 114688 105420 9% 595 3% /var /dev/hd3 16384 12240 26% 70 2% /tmp /dev/hd1 8192 7804 5% 110 6% /home /dev/lv01 884736 114024 88% 2754 2% /oracle /dev/lv02 1007616 368148 64% 18 1% /oracle_back
在命令的输出中可看到文件的大小以KB为单位,其中:
Free列中列出了各个文件系统的剩余可用空间的大小
%Used列中列出了各个文件系统的使用的空间占整个文件系统大小的百分比
Iused列中列出了各个文件系统中使用的inode的个数
%Iused列中列出了各个文件系统中inode使用的百分比
Mounted on列中列出了各个文件系统的mount point
从以上信息中可以看到各个文件系统的空间使用情况,对于空间的使用率达到80%以上的文件系统都要提前进行文件系统空间的扩大,以适应对空间的需求。
e) 性能监控
系统运行性能分析是较为复杂的系统调整过程。这里介绍使用iostat、vmstat命令做简单的系统运行的性能状态检查。尤其是在应用高峰期,特别需要这样做。以便及时发现系统性能瓶颈,并及时采取措施予以解决。
1) iostat
iostat的基本使用方法是:iostat [interval [count]]
使用命令iostat得到的输出信息类似于:
# iostat tty: tin tout avg-cpu: %user %sys %idle %iowait 0.1 32.9 5.9 17.0 32.3 44.8 Disks: %tm_act Kbps tps Kb_read Kb_wrtn Hdisk0 3.7 34.5 1.9 4664 128 Hdisk1 46.5 526.3 40.2 68116 5048 Cd0 0.0 0.0 0.0 0 0
CPU的%user表示用户级(应用)对CPU的使用率。
CPU的%sys表示系统级(内核)对CPU的使用率。
CPU的%idle表示CPU处在空闲状态的时间比率。
CPU的%iowait表示CPU等待I/O的时间比率。
%user与%sys的总值表示CPU的实际使用率,如果总值超过70,一般认为系统的CPU处理能力不足,可以考虑调整CPU数量、主频或修改应用以提高性能。
%iowait的值越高,表示系统性能对I/O性能的依赖程度越大,%iowait如果超过70%,则I/O已经称为系统性能瓶颈。
在DISK区域中:
%tm_act表示硬盘处于活动状态的时间比率。该值越大,表示该硬盘称为I/O瓶颈的可能性越大。
Kbps表示该硬盘的每秒数据交换总量。
Tps表示该硬盘每秒的I/O请求量。
Kb_read表示总的数据读量。
Kb_wrtn表示总的数据写量。
分析DISK区域可以判断哪些硬盘的数据读写最大,从而可以通过数据分布来平均使用多个硬盘,提高I/O性能。
2) vmstat
vmstat的基本使用方法是:vmstat [interval [count]]
使用命令vmstat得到的输出信息类似于:
# vmstat 2 5 kthr memory page faults cpu ----- ----------- ------------------------ ------------ ----------- r b avm fre re pi po fr sr cy in sy cs us sy id wa 0 0 19097 1498 0 0 0 0 0 0 117 310 30 0 1 99 1 0 0 19097 1498 0 0 0 0 0 0 121 168 34 0 1 99 0 0 0 19097 1498 0 0 0 0 0 0 126 118 34 0 0 99 0 0 0 19097 1498 0 0 0 0 0 0 121 118 38 0 0 99 0 0 0 19097 1498 0 0 0 0 0 0 122 121 34 0 0 99 0
Kthr的r表示在运行队列中处于等待状态的核心线程的数量。该值为0表示系统空闲,该值越大表示CPU越忙。Kthr的b表示在等待队列中处于等待状态的核心线程的数量。该值越大表示线程对I/O的等待时间越长。Memory中的avm表示处于使用状态的虚拟和实际内存的总数量。该值的大小不表示系统性能的优劣。Memory中的fre表示空余的RAM页。该值太小表示系统内存可能存在不足的问题,值得关注。Page表示交换空间的使用状态。在内存空间充足的情况下该域对应的各值应为0。当该域各值经常为非0时,表示内存空间不足,经常使用磁盘上的交换空间,从而导致系统性能降低。
CPU中的各值与iostat中关于CPU的描述部分类似。
系统日常配置介绍:
a) 扩大文件系统:
smitty chfs change/show characteristics of a Journaled File System 选择要修改的文件系统 进入change/show characteristics of a Journaled File System界面,在SIZE of file system ( in 512-byte blocks )中输入要增加到的文件系统的大小,以512byte为一个块,输入总块数 回车即增加了文件系统空间。
b) 修改主机的IP地址和主机名:
smitty tcpip Minimum Configuration & Startup 选择相应的网卡 进入Minimum Configuration & Startup菜单;在HOSTNAME中输入主机名( 如:6C1_A );在Internet ADDRESS中输入相应的IP地址(如:10.1.1.47);在Network MASK中输入子网掩码 ( 如:255.255.255.0 );在Default GATEWAY Address中输入网关 (如:10.1.1.1 ) 回车生成设置。
使用命令:vi /etc/hosts察看hosts文件,确认新的主机名对应于新的IP地址,如果还存在老的主机名或IP地址,将它删除。
使用命令:ping 主机名 来确认IP地址修改的成功与否,如果可以解析得到新的IP地址,则成功修改。并退出系统重新登陆系统。
c) 增加一个VG:
smitty vg Add a Volume Group 在Volume Group name中输入要添加的VG名;在Physical partition size in megabytes中用Tab键选择到合适的大小 (如:36GB的硬盘为64 ) ;在Physical Volume names中用F4键列出可选择的硬盘,选择需要的硬盘;在Activate volume group AUTOMATICALLY at system restart?中按需求选择yes或no 回车建VG
d) 增加一个LV:
smitty lvm Logical Volumes Add a logical volume 在Volume Group name中选择要将该LV建在哪个VG上 回车进入安装界面:在Logical volume name中输入LV名;在Number of LOGICAL PARTITIONS中输入该lv的大小( LOGICAL PARTITIONS是以VG的Physical partition为单位的 ) 回车开始。
e) 在已有的LV上加文件系统:
smitty jfs Add a Journaled File System on a Previously Defined Logical volume Add a Standard Journaled File System 在安装界面中:在Logical volume name中输入已有的LV名;在MOUNT POINT中输入该文件系统的mount 点;对Mount AUTOMATICALLY at system restart中根据需要选择yes 或no 回车开始安装。
f) 添加文件系统:
smitty jfs Add a Journaled File System Add a Standard Journaled File System 选择索要安装的VG 在安装界面中:在SIZE of file system (in 512-byte blocks)中输入文件系统的大小 (以512 byte为单位输入总块数);在Mount point中输入该文件系统的mount 点;在Mount AUTOMATICALLY at system restart中根据需要选择yes 或no 回车开始安装。
g) 添加用户:
smitty user Add a User 在User name中输入用户名;在Primary Group中输入用户属于哪个组 回车开始建用户
当用户建完后要给用户登录系统的初始口令:使用命令:passwd username 回车添加用户初始口令。
▪ 系统日常管理常用命令介绍:
a) 对交换区的设置:
lsps -a :显示交换区的分布信息
lsps –s :显示交换区的使用信息
smitty pgsp :smitty菜单界面可以在此界面中增加交换区的大小,改变属性等
b) 对卷组的操作:
lsvg :显示系统所有已定义的卷组名称
lsvg –o :显示所有当前系统中可操作的卷组名称
lsvg -l vgname :显示卷组的详细信息,包括使用的空间,pp大小等
varyonvg vgname :加载卷组,使之可用
varyoffvg vgname :使系统释放对卷组的管理,使之不可用
lsvg –l vgname :显示在相应卷组中的所有逻辑卷
lsvg –p vgname :显示相应卷组中的所有硬盘
smitty vg :smitty菜单界面可进行卷组的管理。包括添加、删除卷组,卷组的备份和恢复,卷组的导入和导出等等,改变卷组属性等的操作。
c) 对文件系统的操作:
df –k :显示当前mount在系统中所有文件系统的具体使用情况
mount mount_point :加载在mount point上的文件系统,使之在系统中可用
unmount mount_point :卸载在mount point上的文件系统,使之在不可用
smitty fs :通过smitty菜单界面进行文件系统管理。包括添加、删除文件系统,文件系统的备份、恢复,改变文件系统的属性等等。
fsck :检查文件系统一致性。
d) 对网络有关的操作:
netstat –in :显示当前系统网卡设置的相关信息
netstat –rn :显示当前系统的路由表
smitty chinet :修改网卡的相关属性
smitty tcpip :修改主机名、网卡IP地址等属性
ping ipaddress :监测系统和特定ip地址之间是否相通
hostname :显示主机名
e) 对系统性能的操作:
vmstat 1 :显示每秒钟系统的CPU、内存等的使用情况
iostat 1 :显示每秒钟系统的I/O情况
f) 对系统中设备的操作:
lsdev –Cc type :显示系统中某种当前设置情况
lsattr –El type :显示系统中某种设备的详细属性信息
cfgmgr :自动配置设备、选择和安装设备驱动软件
g) 对系统资源的操作:
lssrc –a :显示全部系统资源状态
lssrc –g group :显示指定的系统资源组状态
lssrc –s subsystem:显示指定的子系统状态
▪ 系统管理可参考资料:
IBM的AIX操作系统的光盘中,有2张documentation的光盘,其中包含了从AIX的基本操作到高级管理以及故障诊断的各个方面,是系统管理员最佳参考资料。