Linux常见系统故障排除

简介:

前言

   运维人员经常会遇到各式各样的系统故障,如何根据故障特征锁定问题根源,需要的不仅仅是技巧,还有遇到故障时的思路,和对系统内部的理解,本文列出了一些常见的系统故障和处理方法,在那之前首先需要对系统启动流程有一个比较完整意义上的了解,以便问题出现后判断其属于哪个环节。

Linux系统启动流程的基本知识

1、加电自检(PowerOnSelfTest)

   开机自动映射rom中程序到cpu可以寻址的空间中,cpu执行指令检查基本硬件是否正常

2、BIOS(Boot Sequence)

   如果正常则按照CMOS中保存的BootSequnece依次寻找对应设备上的MBR

3、MBR(BootLoader)

   读取第一个MBR存在的设备中的BootLoader,并交与其控制权。

   Linux下的常见BootLoader有两种:

           LILO: LInux LOader(不能引导1024柱面以后的分区内核(嵌入式))

           GRUB: GRand Unified Bootloader

   MBR空间有限,无法展示其特性,所以将GRUB分为2阶段程序,如下:

       Stage1(被装载MBR当中)                主要目的是为了引导第二阶段

       Stage1.5(/boot/grub/Stage1_5)   识别常见不同类型的文件系统

       Stage2(/boot/grub/Stage2)         引导操作系统(突破了446字节的限制)         并借助配置件/boot/grub/grub.conf

4、Kernel

   设备探测

   驱动初始化(可能会从initrd(RHEL6 initramfs)文件中装载驱动模块)

   为内核提供访问根文件系统的基本驱动能力

   以只读挂载根文件系统

   装载第一个进程init

5、init(etc/inittab)

   /sbin/init         其配置文件(etc/inittab)

   /etc/inittab     主要任务如下:

          1、设定偶人运行级别

          2、运行系统初始化脚本

          3、运行制定运行级别目录下的脚本

          4、设定Ctrl+Alt+Del组合键的操作

          5、定义UPS电源在电源故障/恢复时执行的操作

          6、启动6个虚拟终端(2345级别)

          7、启动图形终端(5级别)

常见系统错误

1、忘记密码

   启动进入单用户模式

   使用passwd修改root密码

2、bootloader损坏

   载入安装光盘进入紧急救援模式

   进入grub模式


   重复成功

3、bash丢失系统无法启动

   进入救援模式后

4、加密grub和内核

5、因某服务异常导致系统无法启动

总结七个点:

1、确定问题的故障特征

2、重现故障

3、使用工具收集进一步信息,确定问题根源

4、排除不可能的原因

5、定位故障

6、备份源文件

7、尽可能借助于工具




本文转自 ftmoonfans  51CTO博客,原文链接:http://blog.51cto.com/soulboy/1277190

相关文章
|
1月前
|
Ubuntu Linux Anolis
Linux系统禁用swap
本文介绍了在新版本Linux系统(如Ubuntu 20.04+、CentOS Stream、openEuler等)中禁用swap的两种方法。传统通过注释/etc/fstab中swap行的方式已失效,现需使用systemd管理swap.target服务或在/etc/fstab中添加noauto参数实现禁用。方法1通过屏蔽swap.target适用于新版系统,方法2通过修改fstab挂载选项更通用,兼容所有系统。
133 3
Linux系统禁用swap
|
1月前
|
Linux
Linux系统修改网卡名为eth0、eth1
在Linux系统中,可通过修改GRUB配置和创建Udev规则或使用systemd链接文件,将网卡名改为`eth0`、`eth1`等传统命名方式,适用于多种发行版并支持多网卡配置。
183 3
|
Ubuntu Linux 网络安全
Linux系统初始化脚本
一款支持Rocky、CentOS、Ubuntu、Debian、openEuler等主流Linux发行版的系统初始化Shell脚本,涵盖网络配置、主机名设置、镜像源更换、安全加固等多项功能,适配单/双网卡环境,支持UEFI引导,提供多版本下载与持续更新。
153 0
Linux系统初始化脚本
|
2月前
|
运维 Linux 开发者
Linux系统中使用Python的ping3库进行网络连通性测试
以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性,并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。
153 18
|
1月前
|
安全 Linux Shell
Linux系统提权方式全面总结:从基础到高级攻防技术
本文全面总结Linux系统提权技术,涵盖权限体系、配置错误、漏洞利用、密码攻击等方法,帮助安全研究人员掌握攻防技术,提升系统防护能力。
150 1
|
1月前
|
监控 安全 Linux
Linux系统提权之计划任务(Cron Jobs)提权
在Linux系统中,计划任务(Cron Jobs)常用于定时执行脚本或命令。若配置不当,攻击者可利用其提权至root权限。常见漏洞包括可写的Cron脚本、目录、通配符注入及PATH变量劫持。攻击者通过修改脚本、创建恶意任务或注入命令实现提权。系统管理员应遵循最小权限原则、使用绝对路径、避免通配符、设置安全PATH并定期审计,以防范此类攻击。
613 1
|
2月前
|
缓存 监控 Linux
Linux系统清理缓存(buff/cache)的有效方法。
总结而言,在大多数情形下你不必担心Linux中buffer与cache占用过多内存在影响到其他程序运行;因为当程序请求更多内存在没有足够可用资源时,Linux会自行调整其占有量。只有当你明确知道当前环境与需求并希望立即回收这部分资源给即将运行重负载任务之前才考虑上述方法去主动干预。
967 10
|
2月前
|
安全 Linux 数据安全/隐私保护
为Linux系统的普通账户授予sudo访问权限的过程
完成上述步骤后,你提升的用户就能够使用 `sudo`命令来执行管理员级别的操作,而无需切换到root用户。这是一种更加安全和便捷的权限管理方式,因为它能够留下完整的权限使用记录,并以最小权限的方式工作。需要注意的是,随意授予sudo权限可能会使系统暴露在风险之中,尤其是在用户不了解其所执行命令可能带来的后果的情况下。所以在配置sudo权限时,必须谨慎行事。
395 0
|
2月前
|
Ubuntu Linux 开发者
国产 Linux 发行版再添新成员,CutefishOS 系统简单体验
当然,系统生态构建过程并不简单,不过为了帮助国产操作系统优化生态圈,部分企业也开始用国产操作系统替代 Windows,我们相信肯定会有越来越多的精品软件登录 Linux 平台。
148 0
|
2月前
|
Ubuntu 安全 Linux
Linux系统入门指南:从零开始学习Linux
Shell脚本是一种强大的自动化工具,可以帮助您简化重复的任务或创建复杂的脚本程序。了解Shell脚本的基本语法和常用命令,以及编写和运行Shell脚本的步骤,将使您更高效地处理日常任务。
252 0