开发者学堂课程【高校精品课-长安大学 -基于混合式教学的云计算课程建设:2.2.2 物理资源层 存储系统】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1073/detail/15454
2.2.2 物理资源层 存储系统
主要内容:
一、存储系统
二、存储设备的类型
三、独立磁盘冗余阵列 RAID
一、存储系统
首先讲述常见的持久存储设备类型,接着会讲述独立磁盘冗余阵列( RAID )及其在数据保护和存储性能提升方面的应用,最后讲述不同类型的存储系统体系结构,基于数据块的存储系统,基于文件的存储系统,基于对象的存储系统和统一存储系统。
1.存储系统简介:
个人企业和应用程序产生的数据需要持久地存储下来,以便在需要使用这些数据进行处理或分析时可以检索它们,存储系统是用于保存和检索电子数据的存储,对任何云基础架构而言都是不可或缺的,一个存储系统包含多个用来持久存储和检索数据的设备,成为存储设备或者简称的存储,存储容量通常随计算系统提供给使用者,除了随计算系统提供存储之外,提供商还可以以服务的形式提供存储容量,也就是存储即服务,使用者通过此服务便可将其数据存储在提供商在云中的存储系统上,这使得使用者能够将云存储资源用于数据备份和长期的数据保留。
云存储技术架构,通常在逻辑上将一个或多个数据中心内的存储资源聚合起来,并将他们池化,从而可以提供虚拟存储资源,云存储使得存储资源具备大规模可扩展性和快速弹性,云存储基础架构通常有多个租户或使用者共享,这可提高存储资源的利用率。
二、存储设备的类型:
1.磁盘驱动器
磁盘,是一种圆形的存储介质,由非磁性材料和铁磁材料涂层组成,通过极化部分磁盘表面,将数据存储在磁盘的正反两面上,磁盘驱动器是一种由金属或塑料外壳内垂直堆叠的多个旋转磁盘,成为盘片组成的设备,每个盘片都有一个用于从磁盘读取数据并将数据写入磁盘的,快速移动臂。
在性能密集型应用程序的数据存储和访问方面,磁盘驱动器是目前应用最广泛的存储介质,磁盘支持快速访问随机数据,因而可以为多个并发用户或应用程序快速写入或检索数据提供支持。
磁盘驱动器使用预定义的协议,例如: ATA / IDE 、串行 ATA SATA、小型计算机系统接口 SCSI 、串行 SCSI 接口 SAS 和光纤通道 FC 等等,这些协议驻留在磁盘接口驱动器上,而磁盘接口控制器通常与磁盘驱动器集成在一起,在每种协议都有各自独特的性能成本和容量特征。
2.固态(闪存)驱动器
SSD ,SSD 使用基于半导体的内存来存储和检索数据,所以 SSD 又称作闪存驱动器,可以提供对性能敏感的应用程序所需的超高性能,与传统的机械磁盘驱动器不同,它不包含移动部件,因此不会出现与读写磁头移动和磁盘旋转相关的延迟,与其他可用的存储设备相比, SSD 能以非常短的响应时间达到相对较高的,每秒的输入输出操作数,也存在 IPS ,此外,与机械系统相比,SSD 的能耗更低,使用寿命通常也会长一些,但是 SSD 的价格要比磁盘驱动器要高。
3.磁带机
磁带是一种匍匐有钡铁氧体等可磁化材料的一种长条形的塑料薄膜,磁带装在塑料磁带盒中,磁带机是用于在磁带上记录和检索数据的设备,磁带机提供以线性方式对数据进行顺序读写方面的机制磁带机可以是一个独立的设备,也可是磁带库的一部分,一个磁带库,包含一个,或多个磁带机和一个存储区域,那么存储区域的插槽内则装有大量的磁带盒,磁带由于成本相对较低,且可携带,所以是广受欢迎的一种长期存储介质,组织通常使用磁带机来存储大量的数据,其目的,通常是用于备份异地归档和灾难恢复,磁带由于采用顺序访问机制,访问速度很慢,而且无法由多个应用程序同时访问,而且不断的读写磁头接触会导致磁带表面退化。
4.光盘驱动器
光盘是由聚碳酸酯制成的圆形扁平存储介质,其一面具有特殊的反射涂层,光盘驱动器使用刻写激光将数据以微小的亮点和暗点的形式记录在光盘上,读取激光可读取这些点并生成代表数据的信号,常见的光盘类型有压缩光盘、CD 数字、通用光盘 DVD 和蓝光光盘 BD 等等,光盘因为容量和速度有限,无法用作通用的企业数据存储解决方案,但高容量光盘有时会用于固定内容和归档数据的存储解决方案.
三、独立磁盘冗余阵列 RAID
由于机械磨损或其他的一些环境因素,磁盘驱动器很容易发生故障,磁盘驱动器的故障可能会导致数据丢失,每个磁盘驱动器都有一个预期的寿命,但是当今我们数据中心在其存储系统架构中部署了数以千计的磁盘驱动器,那么磁盘阵列中的磁盘驱动器数量越多,阵列中发生磁盘故障的几率就越大,那么开发 RAID 的技术的目的就是为了减轻这个问题。
RAID 是一种存储技术,也就是说将多个磁盘驱动器合并成一个称作 RAID 的逻辑单元而数据,则写入跨该 RAID 组中多个磁盘的数据块中, RAID 通过使用冗余驱动器和奇偶校验,可防止在驱动器出现故障时丢失数据,而且由于同时使用多个磁盘驱动器来满足读写操作的需要,因此 RAID 还有助于提高存储系统的性能,譬如,如果 RAID 组有4个磁盘驱动器,那么数据就会多管齐下,同时向所有这4个磁盘驱动器写入,那么这种情况与使用单个驱动器相比,性能将提升4倍,同样在读操作期间,也会同时从每个驱动器检索数据, RAID 通常通过使用存在于主机或阵列上的专用硬件控制器加以实施,那么 RAID 控制器的关键功能包括管理和控制驱动器具和,在逻辑驱动器和物理驱动器之间转发 I/O 请求,以及在驱动器出现故障时重新生成数据。
三种不同的 RAID 技术为定义各种 RAID 的级别,奠定了基础,那么这三种技术分别是;条带化、镜像和奇偶效应,这三种技术决定着 RAID 组的数据可用性和性能,以及部署存储解决方案的相关成本,云提供商必须选择适当的 RAID级别来满足云服务交付的要求。
1.条带化技术
条带化是为了并行使用驱动器,而将数据分布到多个驱动器中的技术,与使用单个驱动器相比,这种技术可以提高性能, RAID 组中的每个驱动器,都有预订数量的,可连续寻址的数据块,我们称之为条块,那么跨 RAID 组中所有驱动器的一组对齐的条块,我们成称之为一个条带,条带中的所有条块都包含相同数量的数据块,虽然条带化 RAID 可改善读写性能,但它的磁盘出现故障时,却无法提供任何数据保护。
2.镜像
镜像是一种 RAID 技术,它是将相同数据同时存储在两个不同的驱动器上,从而产生两份数据拷贝,这两个驱动器,称为一个镜像对,那么即使一个驱动器出现故障,另一个正常运行的驱动器上的数据仍然是完好无损的,这种情况下 RAID 控制器将继续使用镜像,镜像对中另一个正常运行的驱动器来满足数据请求,使用新磁盘更换出故障的磁盘后,控制器会从镜像对中正常运行的磁盘将数据拷贝到新磁盘,那么主机是完全察觉不到这种活动,除了提供数据冗余外,镜像还是系统能在磁盘出故障时快速得到恢复,由于镜像涉及复制数据,因此需要的存储容量是所存储的数据量的两倍,那么这会导致成本的攀升,因此镜像通常适合于,无法承受任何数据丢失风险的任务关键性应用程序,镜像会提高读取性能,因为可以使用两个磁盘来满足读取请求,但是与使用单个磁盘和条带化相比,使用镜像时写入性能会略有下降,因为每个写入请求都意味着要对磁盘驱动器进行两次写入。
3.奇偶校验
奇偶校验是一个值,通过对各个数据条块执行数学运算得出并存储在 RAID 组的某个部分,它使得在驱动器出现故障时,能够重新创建丢失的数据,奇偶校验是一项冗余技术,能够确保数据得到保护,同时又无需维护整个重复数据集, RAID 控制器使用按位异或等技术来计算奇偶校验,奇偶校验信息可以存储在单独的专用磁盘驱动器上,也可以分布在一个 RAID 组中的多个驱动器上,那么与镜像相比,执行奇偶校验可大幅减少与数据保护关联的成本,但是奇偶校验实施时,数据每次出现变化时都会重新计算奇偶校验,都会影响到 RAID 阵列的性能。
在上图中,可以看到前4个磁盘,第一到第4包含数据,那么它的数据分别是4、6、1、7,那么第5个磁盘标有 p ,存储奇偶校验信息,那么也就是18,这是这些数据元素的总和,那么如果其中一个驱动器出现故障,可通过从奇偶校验之中减去其余元素的总和来计算丢失的值。
4.常用的 RAID 级别
RAID 级别,是指条带化镜像和奇偶校验技术的实施方案,那么 RAID 级别,它使用一种技术,而有些则组合使用几种技术。
常用的 RAID 级别有 RAID 0 、 RAID 1 、 RAID 1+0、 RAID 3 、 RAID 5 和 RAID 6 。
RAID 0不具有容错能力的一种条带化集。
RAID 1就是磁盘镜像。
那么 RAID 1+0 它是一种嵌套的 RAID (条带化和镜像)。
RAID 3 是支持并行访问并具有专用奇偶校验磁盘的条带化集。
RAID 5 支持独立磁盘访问并采用分布式奇偶校验条带化集,所以他和 RAID 3在存储奇偶校验的方式是不同的。
RAID 6支持独立磁盘访问便并采用双重分布方式奇偶校验的条带化集。