xv6(8) 磁盘及分区理论

简介: 磁盘及分区理论

首发公众号:Rand_cs

磁盘及分区理论

温彻斯特硬盘

今天我们所使用的机械硬盘实质上都是温彻斯特硬盘,最早是在 1973 年由 IBM 研制的一种新型硬盘 IBM 3340。它使用了一种了不起的技术:磁头不与盘片接触,只有不予接触才可能有着更高的转速而且磁盘才不易损坏。至于这个名字的来历,是因为 IBM3340 拥有两个 30MB de 存储单元,而当时一种很有名的 “温彻斯特来福枪” 的口径和装药也恰好包含了两个数字 “30”;于是这种硬盘的内部代号就被定为 “温彻斯特”。

我们来看看这种硬盘的结构图:

image.png

盘片盘面磁头

上图中光盘状的东西就是盘面,有两个面叫做盘面,上面分布着磁性介质。每个盘面都有个磁头,用来读写盘面上的数据。

磁道扇区

image.png

上图中灰色的圆环就是磁道,磁道上的绿色的一段弧为扇区,扇区是磁盘读写的基本单位,通常为512字节

柱面

image.png

每个磁道由外向里从 0 编号,不同盘面上编号相同的磁道组成的圆柱称为磁盘的柱面

相关计算

硬盘容量

$容量 = 盘片数 \times 2 \times 磁道数 \times 扇区数 \times 512$

访问时间

寻道时间

将磁头移动到相应的磁道上所需要的时间

旋转时间

将目标扇区的第一位移动到磁头下面所需要的时间,计算时一般用平均旋转时间即旋转半圈需要的时间。

传送时间

也就是磁盘旋转读取数据的时间,一般也取决于旋转速度。

看几个经典例题:

image.png

寻道时间:$6ms$

平均旋转时间:$\frac{60}{10000} \times 1000 \div 2 = 3ms$

传送时间:这里给出了传输速率那就直接用他给的这个速率来算:$4 \div 1024 \div 20 \times 1000 \approx 0.2ms$

所以总时间再加上磁盘控制器的延迟则为:$6+3+0.2+0.2=9.4ms$

寻址

CHS

CHS 即 Cylinder(柱面)、Heads(磁头)、Sector(扇区),使用这三个参数来定位一个扇区,柱面参数使磁头臂移动到某个半径,磁头参数确定是哪个盘面上的磁道,扇区参数则确定该磁道上某个扇区的具体位置

柱面,磁头一般都是从 0 开始编号,扇区从 1 开始编号

早期 CHS 这个三元组用 24 位来表示,前 10位 表示柱面,中间 8 位表示磁头,后面 6 位表示扇区,最大寻址空间为 $2^{10}\times2^8\times2^6\times512\div2^{30} = 2^3=8GB$。

LBA

LBA(Logical Block Addressing),逻辑块地址实际上就是 CHS 的转化,将三元组转换为一维的线性地址。转换方式如下:

$CHS = (C,H,S)$

$LBA = (C\times磁头数+H)\times扇区数+(S-1)$

最后加上 $S - 1$ 是因为 $LBA$ 从 $0$ 开始编号,这个转换只适用于每个磁道扇区数一样多的磁盘,现在的磁盘都不是这样的了,有 LBA 与 CHS 有更复杂的转换机制,这都不是我们需要考虑的了,硬件厂商已经为我们做好了。

FAQ

每个磁道的扇区数一样多吗?

前面也回答了,不是,早期的硬盘每个磁道的扇区数是一样的,外磁道和内磁道的记录密度是不等的,外磁道稀疏内磁道密集,这也造成了很多浪费。因此后来出现了 ZBR(Zone Block Record),采用等密度结构,即外磁道的扇区数多于内磁道的扇区数,如下图所示:

image.png

显然,因为磁道的扇区数可能不一样,逻辑地址和物理地址之间的转换将更加复杂精细,这一部分都是由磁盘控制器来做的,根据各个磁盘的特性设置芯片来具体工作,不需要我们认为操心了解即可。

另外硬盘的旋转速度一般是保持恒定的,而外磁道的扇区数又要多于内磁道,所以单位时间内扫过的扇区数明显外磁道是要多于内磁道的,因此外磁道的数据传输速度是要快于内磁道的。

扇区信息

扇区一般由两部分组成,一部分是头区域,另一部分是数据区域。数据区域不用多说,就是存储数据的部分,而头区域则包括包含驱动器和控制器使用的信息,具体来说就是一些地址标识,缺陷标识以及错误检测和纠正信息。

寻找相应的扇区就是依靠扇区记录的头信息来寻找的,期间磁盘控制器需要检验这些头部信息和传输数据,需要花费一定时间才能访问下一个扇区,所以扇区号的物理排列不应是连续的,如果连续的话有可能刚处理完当前扇区,磁头已经转到之后的好几个扇区了,再想处理下一个扇区的话得等待许久。所以磁盘出厂时一般都会做低级格式化,跳跃着将扇区编号,给检验传输等留出足够的时间。而高级格式化就是给磁盘分区制作文件系统。

扇区、块/簇、页

扇区:硬盘最小的读写单元

块/簇:多个扇区组合在一起为一个块,一般是 $2^n$ 个扇区,是操作系统对硬盘读写最小单元

页:操作系统与内存之间操作的最小单元,一般 $4KB$

MBR分区

关于分区前面说过一些,这里再仔细讲讲。这儿主要讲的是传统的 $MBR$ 分区。

$MBR(Main Boot Record)$主引导记录,它位于整个硬盘的第一个扇区即 0 柱面,0 磁头,1 扇区(前面说过 $CHS$ 方式以 1 开始编号)。分为三部分:

  1. 引导程序和一些参数,$446$ 字节
  2. 分区表 $DPT$,$64$ 字节
  3. 结尾标记 $0x55$ 和 $0xAA$,2字节

分区表

分区表有 4 个表项,每个表项 16 字节,结构如下:

image.png

扩展分区

分区表只有 4 个表项,也就是说只能原生支持 4 个分区,现在来说 4 个分区远远不够,于是有了扩展分区。

扩展分区是可选项可有可无,有最多只有一个,为了区分其他的三个分区称为主分区

扩展分区可以分为多个子扩展分区,子扩展分区就像是一个单独的硬盘,最开始的扇区为扩展引导扇区 EBR,结构同 MBR,只是分区表只用了两项,第一项表示该子扩展分区的逻辑分区,第二项表示下一个子扩展分区,其他两项为 0 。因此扩展分区就像是构建了一个单链表,将各个子扩展分区连起来

关于 MBR,EBR 的分区表项中起始偏移扇区注意以下几点:

  1. MBR 的分区表项中,起始偏移扇区的基准为 0
  2. EBR 描述逻辑分区的起始偏移扇区基准为该子扩展分区的地址,也就是上一个子扩展分区中 EBR 记录的下一个子扩展分区的偏移扇区
  3. EBR 描述下一个子扩展分区的起始偏移扇区基准为总扩展分区地址,也就是 MBR 中记录的扩展分区的偏移扇区

来看一看一个硬盘的分区布局图:

image.png

OBR(OS Boot Record),位于主分区/逻辑分区的第一个扇区,称为操作系统引导扇区,还记得分区表项中第 0 个字节吗,如果为 0x80 则说明该分区有 OBR 存在操作系统,能够引导是为活动分区

MBR,EBR,OBR 这三个不要弄混淆了,MBR 位于整个磁盘的第一个扇区,里面的分区表描述的是主分区和总扩展分区。而 EBR 位于子扩展分区的第一个扇区,分区表描述的是是逻辑分区和下一个子扩展分区。OBR 位于实际分区的第一个扇区,它是操作系统的引导程序,用来加载操作系统

但实际上述讲述的这些规则 xv6 一个都没用上,想想 xv6 的启动,简化了很多很多,基本不沾边。

FAQ

每个分区最大容量是多少?

分区表项中最后 4 字节表示容量,因为只用了 4 字节来表示总的扇区数,如果每个扇区的容量为 512 字节的话,则每个分区最大容量为:

$$2^{32}\times512 \div 2^{40} = 2TB$$

空闲扇区

分区时不能跨柱面,也就不能跨磁道,而 MBR,EBR 需要占用一个扇区,分区不会与它们处于同一个磁道,因此分区通常会偏移一个磁道的大小,期间这没用的扇区就是空闲扇区。

GPT分区

传统的 MBR 分区有许多限制,比如只能支持 4 个主分区,而且每个分区大小不能超过 2TB 等等,所以后来提出了一种新的方案 GPT,它有着以下优点:

  1. 每个硬盘的分区数分区大小几乎没有限制
  2. 分区表有备份,磁盘首位分别保存了一份相同的分区表
  3. 关键数据结构有循环冗余检测
  4. 使用全局标识符(GUID)来标识分区类型
  5. 每个分区有名称

使用 GPT 分区的磁盘叫做 GPT 磁盘,其结构布局如下所示:

image.png

保护性MBR

位于 LBA0,第 0 个扇区,为了兼容性考虑还是存储的传统的 MBR,叫做保护性 MBR,只有一个类型为 0xEE 的分区表项表示该磁盘使用 GPT 分区,保护性 MBR 的主要作用是保护不能识别 GPT 分区的磁盘工具对其进行操作

分区表头

位于 LBA1,第 1 个扇区,主要结构如下:

image.png

分区表项

位于 LBA2—LBA33 ,结构如下:

image.png

各个字节表示什么应该很清楚了,就不具体解释了,LBA33 之后就是各个具体的分区,然后磁盘最后 33 个扇区是倒着存放的分区表头和分区表。这就是整个 GPT 磁盘的布局,再回头去看看整个分区布局图,应该会很清晰了。

好了本节就这样吧,有什么问题还请批评指正,也欢迎大家来同我讨论交流学习进步。
首发公众号:Rand_cs

目录
相关文章
|
4天前
|
存储 缓存 Linux
xv6(9) 文件系统理论部分
文件系统理论部分
53 0
|
4天前
|
存储 缓存 IDE
xv6(10) 文件系统:磁盘&缓冲区
文件系统:磁盘&缓冲区
48 0
|
存储 程序员 编译器
C++内存分区模型
C++内存分区模型
121 0
C++内存分区模型
|
运维 Java Shell
记一次df -Th与du -sh空间大小不一致磁盘爆满问题的处理过程
记一次df -Th与du -sh空间大小不一致磁盘爆满问题的处理过程
312 0
记一次df -Th与du -sh空间大小不一致磁盘爆满问题的处理过程
|
缓存 算法 固态存储
磁盘算法
磁盘算法
204 0