1、Linux操作系统引导过程
1.1 引导过程总览
linux引导过程一般包括以下几个阶段: 开机自检 、 MBR 引导 、GRUB 菜单 、加载Linux内核 、 init 进程初始化 。
1.1.1 开机自检
服务器主机开机以后,将根据主板 BIOS 中的设置对 CPU(Central Processing Unit, 中央处理器)、内存、显卡、键盘等设备进行初步检测,检测成功后根据预设的启动顺序移交系统控制权,大多时候会移交给本机硬盘。
1.1.2 MBR引导
当从本机硬盘中启动系统时,首先根据硬盘第一个扇区中 MBR(Master Boot Record, 主引导记录)的设置,将系统控制权传递给包含操作系统引导文件的分区;或者直接根据 MBR 记录中的引导信息调用启动菜单(如 GRUB)。 总结:运行放在MBR扇区里的启动菜单GRUB引导程序。
1.1.3 GRUB菜单
对于 Linux 操作系统来说,GRUB(GRand Unified Bootloader,统一启动加载器)是使用最为广泛的多系统引导器程序。系统控制权传递给 GRUB 以后,将会显示启动菜单给用户选择,并根据所选项(或采用默认值)加载 Linux 内核文件,然后将系统控制权转交给内核。需要注意的是,CentOS 7 采用的是 GRUB2 启动引导器。 总结:GRUB引导程序通过读取GRUB配置文件/boot/grub2/grub.cfg,来获取内核和镜像文件系统的设置和路径位置。 (即选择内核文件和系统类型)
1.1.4 加载Linux内核
Linux 内核是一个预先编译好的特殊二进制文件,介于各种硬件资源与系统程序之间, 负责资源分配与调度。内核接过系统控制权以后,将完全掌控整个 Linux 操作系统的运行过 程。在 CentOS 系统中,默认的内核文件位于“/boot/vmlinuz-3.10.0-514.el7.x86_64”。 总结:把内核和镜像文件系统加载到内存中,使其可以使用。
1.1.5 init进程初始化
为了完成进一步的系统引导过程,Linux内核首先将系统中的“/sbin/init”程序加载到内存中运行(运行中的程序称为进程),init 进程负责完成一系列的系统初始化过程,最后等待用户进行登录。CentOS 7 采用的是 Systemd 启动方式。 总结:加载硬件驱动程序,内核把init进程加载到内存中运行。
1.2 系统初始化进程(init和Systemd介绍)
1.2.1 init进程
- 由Linux内核加载运行/sbin/init 程序;
- init进程是系统中第一个进程;
- init进程的PID(进程标记)号永远为1。
1.2.2 Systemd进程
- Systemd是Linux操作系统中的一种init软件;
- CentOS7中采用全新的Systemd启动方式,取代传统的SysVinit;
- CentOS7中运行的第一个init进程是/lib/systemd/systemd
使用 pstree 命令可以查看系统中的所有进程,可以看出systemd是所有进程的父进程。
使用 ps 命令可以查看所有进程的PID,可看出systemd的进程号始终为1。
1.2.3 传统init和systemd比较
- 传统init依赖于串行执行Shell 脚本启动服务,导致效率低下,系统启动速度较慢。
- Systemd能够将更多的服务进程并行启动,并且具有提供按需启动服务的能力,使得启动更少进程,从而提高系统启动速度 。
1.3 Systemd 单元类型
在Systemd中不同类型的systemd对象被统一称为单元(unit),是让系统知道该如何进行操作和管理资源的主要对象,所以systemd有许多单元类型。 Systemd单元文件最初默认存放在/lib/systemd/system目录中,每当安装新的软件都会自动在这个目录中添加一个配置文件。通过配置文件进行标识和配置不同单元;文件中主要包含了系统服务、监听。
单元类型 | 扩展名 | 说明 |
Service | .service | 描述一个系统服务 |
Socket | .socket | 描述一个进程间通信的套接字 |
Device | .device | 描述一个内核识别的设备文件 |
Mount | .mount | 描述一个文件系统的挂载点 |
Automount | .automount | 描述一个文件系统的自动挂载点 |
Swap | .swap | 描述一个内存交换设备或交换文件 |
Path | .path | 描述一个文件系统中文件或目录 |
Timer | .timer | 描述一个定时器(用于实现类似cron的调度任务) |
Snapshot | .snapshot | 用于保存一个systemd的状态 |
Scope | .scope | 使用systemd的总线接口以编程的方式创建外部进程 |
Slice | .slice | 描述居于Cgroup的一组通过层次组织的管理系统进程 |
Target | .target | 描述一组systemd的单元 |
systemctl 命令用于管理各种类型的systemd单元,可以使用 “systemctl -t help” 命令来查询systemd支持的单元类型。
[root@localhost ~]# systemctl -t help Available unit types: service socket busname target snapshot device mount automount swap timer path slice scope 复制代码
使用“ls /lib/systemd/system”可以查看系统中所有的单元文件。(图片中只是其中一部分)
1.4 运行级别所对应的 Systemd 目标
运行级别 | systemd的target | 说明 |
0 | target | 关机状态,使用该级别时将会关闭主机 |
1 | rescue.target | 单用户模式,不需要密码验证即可登录系统,多用于系统维护 |
2 | rescue.target | 用户定义/域特定运行级别。默认等同于3 |
3 | multi-user.target | 字符界面的完整多用户模式,大多数服务器主机运行在此级别 |
4 | multi-user.target | 用户定义/域特定运行级别。默认等同于3 |
5 | graphical.target | 图形界面的多用户模式,提供了图形桌面操作环境 |
6 | reboot.target | 重新启动,使用该级别时将会重启主机 |
2、排除启动类故障
2.1 修复MBR扇区故障
2.1.1 故障原因和解决思路
故障原因:
- 病毒、木马的等造成的破坏;
- 不正确的分区操作、磁盘读写误操作等。
故障现象:
- 找不到引导程序,启动中断;
- 无法加载操作系统,开机后黑屏。
解决思路:
- 提前添加一块新硬盘;
- 提前做好备份文件(将MBR扇区备份到另一块硬盘上);
- 以安装光盘引导进入急救模式;
- 从备份文件中恢复。
MBR扇区:
第一块硬盘的第一个物理扇区共512字节,其中前446字节为MBR(主引导记录),后64字节为硬盘分区表,最后2字节为硬盘标识。
备份命令:
mkdir /data/aa mount /dev/sdb1 /data/aa dd if=/dev/sda of=/data/aa/mbr.bak count=512 bs=1 复制代码
在光盘中恢复MBR扇区命令:
sh-4.2# mkdir /backup sh-4.2# mount /dev/sdb1 /data/backup sh-4.2# dd if=/backup/mbr.bak of=/dev/sda count=512 bs=1 复制代码
2.1.2 案例演示1(将MBR扇区备份到另一块硬盘)
1)提前添加一块新硬盘,将MBR扇区备份到新硬盘中。
提前添加好新硬/dev/sdb,设置分区sdb1,将sdb1挂载到/data/aa目录下,之后将/dev/sda的MBR扇区备份到/data/aa目录下。
因之前已添加新硬盘并分区,此处不再演示。
[root@localhost ~]# mount /dev/sdb1 /data/aa //将sdb1挂载到/data/aa目录下 [root@localhost ~]# dd if=/dev/sda of=/data/aa/mbr.bak bs=512 count=1 //将MBR扇区备份到/dev/sdb1 中 记录了1+0 的读入 记录了1+0 的写出 512字节(512 B)已复制,0.000181506 秒,2.8 MB/秒 [root@localhost ~]# ls /data/aa mbr.bak 复制代码
2)破坏MBR分区表,模拟扇区故障。
先查看正常的MBR扇区,之后使用空字符串覆盖掉MBR扇区内容(即/dev/sda的前512字节),再查看破坏后的MBR扇区。最后进行重启,查看能否正常启动。
[root@localhost ~]# hexdump -C -n 512 /dev/sda //查看/dev/sda的前512字节 [root@localhost ~]# dd if=/dev/zero of=/dev/sda bs=512 count=1 //使用空字符串覆盖掉前512字节 记录了1+0 的读入 记录了1+0 的写出 512字节(512 B)已复制,0.000149214 秒,3.4 MB/秒 [root@localhost ~]# hexdump -C -n 512 /dev/sda //查看破坏后的MBR扇区 00000000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................| * 00000200 [root@localhost ~]# reboot //重启系统,观察能否正常启动 复制代码
3)重启观察故障情况。因为第一块硬盘的引导程序被破坏,系统自动改用光盘启动。选择Troubleshooting,之后选择rescue mode(急救模式),使用备份文件恢复MBR扇区。
- 重启发生故障,无法正常启动。
- 选择 troubleshooting ,然后选择“Rescue a CentOS system”(急救模式),从备份文件中恢复MBR扇区,最后重新启动。
2.2 修复GRUB引导故障
2.2.1 故障原因和解决思路
故障原因:
- MBR中的GRUB引导程序遭到破坏
- grub.cfg 文件丢失、引导配置有误
故障现象:
- 系统引导停滞,显示“grup>” 提示符
解决思路:
- 尝试手动输入引导命令(笨拙繁琐,不建议使用)
- 提前备份文件,恢复MBR扇区中的grub引导程序
- 进入急救模式,重写或者从备份中恢复grub.cfg 文件