本节书摘来自华章出版社《构建高可用Linux服务器 第3版》一 书中的第2章,第2.6节,作者:余洪春 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.6 检查机房应注意的位置和细节问题
另外,如果我们的服务器都是IDC托管服务器(即服务器不在自己的机房内),建议采用如下做法:
服务器中最容易坏掉的是风扇,尤其是生产环境下的重要服务器,建议都配置成集群环境,这样也方便自己进行检查或升级,如果发生单机硬件Crash的情况也不会影响重要业务;如果是自己的内网服务器机房,平时注意将机房温度控制在17℃。
DELL系列或HP系列的机器中RAID卡放电是正常现象,如果有Nagios报警短信和邮件也是正常的。
有时间就多巡视一下机房,检查服务器的硬盘灯指示情况,数据量大的业务应用会很频繁读写硬盘,这时极易发生硬盘故障。
注意网线不要松脱了,否则使用Heartbeat+DRBD的线上业务就很麻烦了。
平时如果有时间,可以做一些关于Keepalived和Heartbeat的模拟故障实验,保证我们的网站或系统的高可用性。
平时可以多学习一些网络相关的知识,并解决一些疑难问题,特别是硬件防火墙的端口映射问题;有时绝大多数的问题是网络方面引起的。