RHEL服务器故障排除精粹

简介:
   大家好!我是书记。今天给大家打来的是Linux服务器中常见故障的一些解决方案。

首先,我们要知道对Linux进行故障排错的学习方法和步骤:
一、要非常熟悉Linux的启动过程。
二、要学会查看日志的好习惯。
三、要具备常见的Linux故障的场景及解决方法的经验。
四、不断的积累、总结。
 
 
引导流程图:
 
 
 
 
(1)修复MBR扇区故障
 
故障原因:
        One:一些病毒、木马等造成的破坏。
        two:不正确的分区操作、磁盘读写的误操作。
故障现象:
        one :无法加载OS,开机后出现黑屏。
        two:找不到引导程序,启动过程中突然中断。
        
解决方案:
         one:应提前作好备份文件
         two:以RHEL5安装光盘引导进入急救模式
         three:从备份文件中恢复
 
Example:
1.备份MBR扇区数据
    dd if=/dev/sda of =/backup/sda.mbr.bak bs=512 count=1
 
2.模拟MBR被破坏额故障
    dd if=/dev/sda of=/dev/sda bs=512 count=1

3.RHEL5关盘引导,进入到急救模式
     boot:linux resure

4.从备份文件中恢复MBR扇区
     dd if=/tempdir/sda.mbr.bak of=/dev/sda bs=512 count=1
 
------------------------------------------------------------------
 
  (2)修复GRUB引导故障
故障原因:
        one :MBR中的GRUB引导程序遭到破坏
        two :grub.conf文件丢失、引导配置有误
 
故障现象:

        系统引过程中停止不前,显示“grub>”提示符
 
 
解决方案:
         手动输入引导命令
         进入急救模式,从备份中恢复grub.conf配置文件
         向MBR扇区中重建grub程序
 
Example:

1.在“grub>”提示符后,手动输入引导命令,
成功进入系统后,恢复或重建 grub.conf 配置文件
grub> root  (hd0,0)
grub> kernel  /vmlinuz-2.6.9-5.EL ro root=LABEL=/ rhgb quiet
grub> initrd  /initrd-2.6.9-5.EL.img
grub> boot
==================================================================
[root@localhost ]# cd  /boot/grub/
[root@localhost ]# cp  grub.conf.bak  grub.conf
==================================================================

2.进入急救模式,从备份文件中恢复 grub.conf 文件,
向MBR扇区中重建GRUB程序

sh-3.1# chroot  /mnt/sysimage
sh-3.1# cd  /boot/grub/
sh-3.1# cp  grub.conf.bak  grub.conf
sh-3.1#  grub-install  /dev/sda
 
(3)etc/inittab文件丢失
故障原因:
inittab文件被误删除,或者存在配置上的问题
故障现象:
         one:启动中提示 “... INIT: No inittab file found”
 

         two:系统停滞,无法完成初始化

解决方案:
         One:进入急救模式,从备份文件中恢复
         two: 在急救模式中重新安装 initscripts 软件包
           rpm  -ivh --aid --force --replacepkgs  initscripts-8.45.14.EL.i386.rpm
 
 (4)etc/fstab文件丢失
故障原因:
               fstab文件被误删除,或者存在配置错误
故障现象:
      one:启动中提示 “... /etc/fstab: No such file or directory”

      two :系统停滞,无法完成初始化
 
解决方案:
           one  :进入急救模式,手动查找并挂载根分区
                     查找逻辑卷:lvm vgscan
                     激活指定的逻辑卷:lvm vgchange -ay  /dev/VolGroup00
           two :恢复或重建fstab配置文件
 
 
 (5)忘记root用户的密码
故障原因:
              忘记root用户的密码
 
故障现象:
                one :无法进行需要root权限的管理操作
                two :若没有其他可用帐号,将无法登录系统
 
解决方案:
           one :引导进入单用户模式(runlevel=1),然后重设密码
                     grub > kernel  ...  single 或 s 或 1
           two :进入急救模式,然后重设密码
 

(6)软件包类故障 —— rpm数据库损坏

故障原因:
              非正常关机、误删除运行中的程序文件
              RPM数据文件被误写或删除

故障现象:
             不能正常查询rpm包信息 rpm -ql ; rpm -qa .....
              无法安装、升级或卸载软件包等 rpm -U ; rpm -i...... 
解决方案:
                重建RPM数据库
                重建命令:rpm  --rebuilddb 或 rpm  --initdb
 

(7)磁盘资源耗尽故障

故障原因:
         one :磁盘空间已被大量的数据占满,空间耗尽
         two :虽然还有可用空间,但文件数i节点耗尽

故障现象:
         one :无法写入新的文件,提示“… : 设备上没有空间”
          two : 部分程序无法运行,甚至系统无法启动

解决方案:
             1. 清理磁盘空间,删除无用、冗余的文件
             2 .转移或删除占用大量i节点的琐碎文件
             3. 进 入单用户模式、急救模式进行修复
             4.用户设置 磁盘配额---系统管理中必做的
 
一些细节上的故障,只要我们做了必要的备份的话, 解决这个问题不会很难。好了,就到这吧!同时祝愿大家天天好心情,偶也!




本文转自 149banzhang 51CTO博客,原文链接:http://blog.51cto.com/149banzhang/707291,如需转载请自行联系原作者
目录
相关文章
|
2月前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
2月前
|
监控 安全 Linux
RHEL 环境下 Subversion 服务器部署与配置
【10月更文挑战第18天】在RHEL环境下部署Subversion服务器需依次完成安装Subversion、创建版本库、配置服务器、启动服务、客户端连接及备份维护等步骤。确保遵循安全最佳实践,保障数据安全。
119 1
|
2月前
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
6天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
20天前
|
运维 监控 负载均衡
slb后端服务器故障
slb后端服务器故障
40 13
|
1月前
|
存储 Unix Linux
服务器数据恢复—DELL EqualLogic PS6100系列存储简介及发生故障后的处理方案
DELL EqualLogic PS6100系列存储采用虚拟ISCSI SAN阵列,支持VMware、Solaris、Linux、Mac、HP-UX、AIX操作系统,提供全套企业级数据保护和管理功能,具有可扩展性和容错功能。
|
2月前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
67 4
|
2月前
|
安全 Linux 数据安全/隐私保护
RHEL 环境下 Subversion 服务器部署与配置
【10月更文挑战第17天】在RHEL环境下部署Subversion服务器包括安装Subversion、创建和配置版本库、启动服务器、客户端连接以及备份与恢复等步骤。通过这些步骤,可确保服务器的安全性和稳定性,满足版本控制需求。
|
2月前
|
运维 安全 Linux
IDC服务器故障排除思路
本文详细介绍了服务器维修流程,包括维修前的工具和备件准备,以及不拆机情况下的初步检查步骤。文中还提供了拆机维修的具体方法,如最小化测试法、替换法和交叉比较法,并针对CPU、主板、内存、硬盘、电源、风扇、网卡及BMC等主要配件的故障排除进行了说明,强调了注意事项,旨在帮助技术人员快速准确地定位并解决问题。
119 13
ly~
|
2月前
|
缓存 监控 安全
反向代理服务器的常见故障有哪些?
反向代理服务器常遇到的故障包括配置错误、网络问题、性能瓶颈及安全漏洞。配置相关故障如错误监听端口、域名配置不当及代理转发规则错误,可使用`netstat -tuln`检查端口状态,并验证域名及DNS解析。网络故障涉及连接中断和带宽不足,利用`ping`和`traceroute`检测连通性,用`iftop`监控带宽。性能问题如资源耗尽和缓存不一致需通过`top`监控资源使用,并检查缓存策略。安全故障包括DDoS攻击和配置漏洞,应使用流量分析工具检测异常并加强安全配置,确保SSL/TLS加密和访问控制策略正确无误。
ly~
184 3