[关键字] RAID数据恢复 数据恢复 磁盘阵列故障
[问题]
IBM的很多服务器有两种特殊的RAID结构,RAID5E与RAID5EE,这两种RAID结构有什么优点,从专业的RAID数据恢复角度看,这两种结构是否值得推荐?
[回答](北亚数据恢复中心张宇,
[url]http://www.datahf.net[/url])
先转贴一段关于RAID5E与RAID5EE的介绍:
RAID5E & RAID5EE
RAID5E和RAID5EE是被经常提起的支持两个磁盘故障的技术,IBM的存储系统就是广泛采用这种RAID技术来实现双磁盘容错。它到底是如何实现,包含什么样的功能?
图-1 RAID5E
RAID5E,是在RAID5中每个 Extent (它是在IBM主机中用于创建RAID的单位) 的后面加入了热备用空间 (Hot Space,如图-1中Extent尾部的HS0、HSr、HSp等) 。如Extent0故障,那么其他剩余Extents的热备份空间将会被用来重建和重新分配数据,并保证剩下的Extents为RAID5的一部分。从而使得即使一个Extent故障,也能马上有热备用磁盘来替换它,并重建RAID5,从而又带来容错力;从而达到所说的支持两个磁盘故障。
但是,它所能容忍的并不是任何两个磁盘同一时刻故障,可以将它看作是RAID5和在线热备用磁盘(online hot spare drives)的变体。它将I/O操作时的数据分布到所有磁盘,包括热备用磁盘;从而减少了每个磁盘的带宽,带来更高的效率。然而,这也就意味着热备用磁盘不能够被多个阵列共享。
在RAID5E中,没有专用的热备用磁盘,就像RAID5中没有专门的校验磁盘一样,热备用数据块是分布到所有的磁盘中;从而,对于10个磁盘的RAID5E,每个磁盘的80%被用于存储数据,10%用于存储校验,10%用于热备用。
图-2 RAID5EE
此外,RAID5EE和RAID5E类似,只是热备用空间被分布在各个Extents中,就像RAID5的检验数据那样分散布置一样;如过某个Extent故障,那么剩余Extent中的热备用空间(如图-2中的HS0, HS1, HS2等),将会被立即用于重建数据,并保证它成为原来RAID5的一部分,从而达到所说的支持两个磁盘故障。
同RAID5E相比,它不是把热备用空间放到每个Extent的尾部,而是分布在数据块其中,它也不允许任何两个磁盘同一时刻故障。不过,RAID5EE在进行热替换时,其寻址可能会更加方便和灵活。
以下是我对这两种结构的看法:
RAID5E与RAID5EE实际上是优化了的RAID5+HOT SPARE,其目的是让多余出来的热备盘同样参与RAID组,实现在一条RAID总线上更快地并行IO。
从RAID5E与RAID5EE的构建方式上看,除了可以提供稍快的读写IO外,其他优点并不明显,很多资料上说可以实现更快的重建速度,其实在RAID5E或RAID5EE降级时,控制器要用很复杂的算法(相对而言),实现在线更改RAID级别(由RAID5E或RAID5EE变更为变种的RAID5)。同时,因RAID级别的变更,RAID组里的所有的硬盘都要进行全面读写。而再加入新的盘时,同样又要通过复杂的算法将RAID5变更回原来的RAID结构。所以在我们接触的好多RAID5E或RAID5EE案例中,客户都是没做任何操作,但数据却被破坏了,当然这有可能是控制器固件的故障,但不可否认的是,这种复杂的操作,高负载的IO也是根源之一。
所以,在IO性能并无特别要求的情况下(RAID5E与RAID5EE的性能提升也并不明显),建议尽可能少用RAID5E或RAID5EE。
本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/133569,如需转载请自行联系原作者