最近因为公司数据库CPU负载一直很高,导致nagios频繁报警,数据库oracle 10G是跑在两台dell服务器linux操作系统搭建的RAC环境,但是机器硬件配置不一样,一个是4C8G,一个是8C8G,这样每天上班时正属业务高峰期,导致低CPU的机器一直报负载高,终究领导层决定从别的系统里面抽出一台8C8G的机器重新搭建RAC,当然RAC是DBA的活,但是运维要负责重新安装操作系统,因为RedHat Linux AS4版本很老,我没有安装过,今天要去托管机房安装了。
因为到公司入职时间刚快1个月,对公司的生产设备的部署还不是很熟悉,到机房一看两台DELL 2950的服务器叠在一起,各自都连接到EMC存储上,网线,电源线,光纤线都很乱,这维护起来也挺费劲的,这里说一下建议,千万最好是不要把几台跑同样业务的设备放在同一个机柜,例如:RAC负载均衡,LVS负载等,如果假如说机柜里面双路电都掉了(虽然这种情况极小),那样的话机柜里面所有的机器都不能工作了,最后想死的心都有了,闲话不扯了,存储我基本不怎么了解,不管三七二十一,开始从U盘安装操作系统,到分区的时候我傻了,因为存储没玩过,现在突然多了sdb,sdc设备出来,操作系统上还识别分配存储的空间,最后无奈也不敢瞎弄,只能将主机连存储的光纤线拔出后重新分区了,结果很显然就只有一个sda的设备了,这里不得不BS一下DELL公司的产品设计人员,那上面的光纤线真的非常难拔出来,设计的人怎么想的,以后不利于工作人员维护,哎!!!
系统顺利的装完了,做好一些基本的配置之后,重启一次主机,发现报错如下:
网上一查看到smartd是一个守护进程,主要是检测硬盘状态的,可以使用如下命令检查看看smartd是否支持你的硬盘检测?
如果不想开机启动的话执行chkconfig --revel 35 smartd off就OK来了。