首发公众号：Rand_cs

磁盘及分区理论

温彻斯特硬盘

今天我们所使用的机械硬盘实质上都是温彻斯特硬盘，最早是在 1973 年由 IBM 研制的一种新型硬盘 IBM 3340。它使用了一种了不起的技术：磁头不与盘片接触，只有不予接触才可能有着更高的转速而且磁盘才不易损坏。至于这个名字的来历，是因为 IBM3340 拥有两个 30MB de 存储单元，而当时一种很有名的 “温彻斯特来福枪” 的口径和装药也恰好包含了两个数字 “30”；于是这种硬盘的内部代号就被定为 “温彻斯特”。

我们来看看这种硬盘的结构图：

盘片盘面磁头

上图中光盘状的东西就是盘面，有两个面叫做盘面，上面分布着磁性介质。每个盘面都有个磁头，用来读写盘面上的数据。

磁道扇区

上图中灰色的圆环就是磁道，磁道上的绿色的一段弧为扇区，扇区是磁盘读写的基本单位，通常为512字节。

柱面

每个磁道由外向里从 0 编号，不同盘面上编号相同的磁道组成的圆柱称为磁盘的柱面。

寻址

CHS

CHS 即 Cylinder(柱面)、Heads(磁头)、Sector(扇区)，使用这三个参数来定位一个扇区，柱面参数使磁头臂移动到某个半径，磁头参数确定是哪个盘面上的磁道，扇区参数则确定该磁道上某个扇区的具体位置。

柱面，磁头一般都是从 0 开始编号，扇区从 1 开始编号。

早期 CHS 这个三元组用 24 位来表示，前 10位表示柱面，中间 8 位表示磁头，后面 6 位表示扇区，最大寻址空间为 $2^{10}\times2^8\times2^6\times512\div2^{30} = 2^3=8GB$。

LBA

LBA(Logical Block Addressing)，逻辑块地址实际上就是 CHS 的转化，将三元组转换为一维的线性地址。转换方式如下：

$CHS = (C,H,S)$

$LBA = (C\times磁头数+H)\times扇区数+(S-1)$

最后加上 $S - 1$ 是因为 $LBA$ 从 $0$ 开始编号，这个转换只适用于每个磁道扇区数一样多的磁盘，现在的磁盘都不是这样的了，有 LBA 与 CHS 有更复杂的转换机制，这都不是我们需要考虑的了，硬件厂商已经为我们做好了。

FAQ

每个磁道的扇区数一样多吗？

前面也回答了，不是，早期的硬盘每个磁道的扇区数是一样的，外磁道和内磁道的记录密度是不等的，外磁道稀疏内磁道密集，这也造成了很多浪费。因此后来出现了 ZBR(Zone Block Record)，采用等密度结构，即外磁道的扇区数多于内磁道的扇区数，如下图所示：

显然，因为磁道的扇区数可能不一样，逻辑地址和物理地址之间的转换将更加复杂精细，这一部分都是由磁盘控制器来做的，根据各个磁盘的特性设置芯片来具体工作，不需要我们认为操心了解即可。

另外硬盘的旋转速度一般是保持恒定的，而外磁道的扇区数又要多于内磁道，所以单位时间内扫过的扇区数明显外磁道是要多于内磁道的，因此外磁道的数据传输速度是要快于内磁道的。

扇区信息

扇区一般由两部分组成，一部分是头区域，另一部分是数据区域。数据区域不用多说，就是存储数据的部分，而头区域则包括包含驱动器和控制器使用的信息，具体来说就是一些地址标识，缺陷标识以及错误检测和纠正信息。

寻找相应的扇区就是依靠扇区记录的头信息来寻找的，期间磁盘控制器需要检验这些头部信息和传输数据，需要花费一定时间才能访问下一个扇区，所以扇区号的物理排列不应是连续的，如果连续的话有可能刚处理完当前扇区，磁头已经转到之后的好几个扇区了，再想处理下一个扇区的话得等待许久。所以磁盘出厂时一般都会做低级格式化，跳跃着将扇区编号，给检验传输等留出足够的时间。而高级格式化就是给磁盘分区制作文件系统。

扇区、块/簇、页

扇区：硬盘最小的读写单元

块/簇：多个扇区组合在一起为一个块，一般是 $2^n$ 个扇区，是操作系统对硬盘读写最小单元

页：操作系统与内存之间操作的最小单元，一般 $4KB$

MBR分区

关于分区前面说过一些，这里再仔细讲讲。这儿主要讲的是传统的 $MBR$ 分区。

$MBR(Main Boot Record)$主引导记录，它位于整个硬盘的第一个扇区即 0 柱面，0 磁头，1 扇区(前面说过 $CHS$ 方式以 1 开始编号)。分为三部分：

引导程序和一些参数，$446$ 字节
分区表 $DPT$，$64$ 字节
结尾标记 $0x55$ 和 $0xAA$，2字节

分区表

分区表有 4 个表项，每个表项 16 字节，结构如下：

扩展分区

分区表只有 4 个表项，也就是说只能原生支持 4 个分区，现在来说 4 个分区远远不够，于是有了扩展分区。

扩展分区是可选项可有可无，有最多只有一个，为了区分其他的三个分区称为主分区。

扩展分区可以分为多个子扩展分区，子扩展分区就像是一个单独的硬盘，最开始的扇区为扩展引导扇区 EBR，结构同 MBR，只是分区表只用了两项，第一项表示该子扩展分区的逻辑分区，第二项表示下一个子扩展分区，其他两项为 0 。因此扩展分区就像是构建了一个单链表，将各个子扩展分区连起来。

关于 MBR，EBR 的分区表项中起始偏移扇区注意以下几点：

MBR 的分区表项中，起始偏移扇区的基准为 0。
EBR 描述逻辑分区的起始偏移扇区基准为该子扩展分区的地址，也就是上一个子扩展分区中 EBR 记录的下一个子扩展分区的偏移扇区。
EBR 描述下一个子扩展分区的起始偏移扇区基准为总扩展分区地址，也就是 MBR 中记录的扩展分区的偏移扇区

来看一看一个硬盘的分区布局图：

OBR(OS Boot Record)，位于主分区/逻辑分区的第一个扇区，称为操作系统引导扇区，还记得分区表项中第 0 个字节吗，如果为 0x80 则说明该分区有 OBR 存在操作系统，能够引导是为活动分区。

MBR，EBR，OBR 这三个不要弄混淆了，MBR 位于整个磁盘的第一个扇区，里面的分区表描述的是主分区和总扩展分区。而 EBR 位于子扩展分区的第一个扇区，分区表描述的是是逻辑分区和下一个子扩展分区。OBR 位于实际分区的第一个扇区，它是操作系统的引导程序，用来加载操作系统。

但实际上述讲述的这些规则 xv6 一个都没用上，想想 xv6 的启动，简化了很多很多，基本不沾边。

FAQ

每个分区最大容量是多少？

分区表项中最后 4 字节表示容量，因为只用了 4 字节来表示总的扇区数，如果每个扇区的容量为 512 字节的话，则每个分区最大容量为：

$$2^{32}\times512 \div 2^{40} = 2TB$$

空闲扇区

分区时不能跨柱面，也就不能跨磁道，而 MBR，EBR 需要占用一个扇区，分区不会与它们处于同一个磁道，因此分区通常会偏移一个磁道的大小，期间这没用的扇区就是空闲扇区。

GPT分区

传统的 MBR 分区有许多限制，比如只能支持 4 个主分区，而且每个分区大小不能超过 2TB 等等，所以后来提出了一种新的方案 GPT，它有着以下优点：

每个硬盘的分区数分区大小几乎没有限制
分区表有备份，磁盘首位分别保存了一份相同的分区表
关键数据结构有循环冗余检测
使用全局标识符(GUID)来标识分区类型
每个分区有名称

使用 GPT 分区的磁盘叫做 GPT 磁盘，其结构布局如下所示：

保护性MBR

位于 LBA0，第 0 个扇区，为了兼容性考虑还是存储的传统的 MBR，叫做保护性 MBR，只有一个类型为 0xEE 的分区表项表示该磁盘使用 GPT 分区，保护性 MBR 的主要作用是保护不能识别 GPT 分区的磁盘工具对其进行操作。

分区表头

位于 LBA1，第 1 个扇区，主要结构如下：

分区表项

位于 LBA2—LBA33 ，结构如下：

各个字节表示什么应该很清楚了，就不具体解释了，LBA33 之后就是各个具体的分区，然后磁盘最后 33 个扇区是倒着存放的分区表头和分区表。这就是整个 GPT 磁盘的布局，再回头去看看整个分区布局图，应该会很清晰了。

好了本节就这样吧，有什么问题还请批评指正，也欢迎大家来同我讨论交流学习进步。
首发公众号：Rand_cs

xv6(8) 磁盘及分区理论

磁盘及分区理论

温彻斯特硬盘

盘片盘面磁头

磁道扇区

柱面

相关计算

硬盘容量

访问时间

寻道时间

旋转时间

传送时间

寻址

CHS

LBA

FAQ

每个磁道的扇区数一样多吗？

扇区信息

扇区、块/簇、页

MBR分区

分区表

扩展分区

FAQ

每个分区最大容量是多少？

空闲扇区

GPT分区

保护性MBR

分区表头

分区表项

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

xv6(8) 磁盘及分区理论

磁盘及分区理论

温彻斯特硬盘

盘片盘面磁头

磁道扇区

柱面

相关计算

硬盘容量

访问时间

寻道时间

旋转时间

传送时间

寻址

CHS

LBA

FAQ

每个磁道的扇区数一样多吗？

扇区信息

扇区、块/簇、页

MBR分区

分区表

扩展分区

FAQ

每个分区最大容量是多少？

空闲扇区

GPT分区

保护性MBR

分区表头

分区表项

热门文章

最新文章

相关电子书