服务器数据恢复—EVA存储介绍&常见故障和数据恢复

简介: EVA存储常见故障:1、RSS中多个磁盘掉线,超过冗余保护级别。2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障。3、VDISK被删除或EVA初始化。4、突发性主机与存储无法连接。无法discover存储。

EVA存储介绍:
EVA存储是以虚拟化存储为实现目的的存储设备,内部的结构完全不同于普通的基于RAID的存储。EVA内部称之为VRAID。
EVA对每个物理磁盘(PV)进行签名(写在每个磁盘的0扇区),签名后即分配到不同的DISK GROUP。
在DISK GROUP中,每个PV会按一定大小划分为若干存储单元(PP),PP的大小为2的整数次幂,且应该在2-16M之间。
每个PV中有一定数量的PP,这些PP结合起来形成整个DISK GROUP的可用空间。
001.jpg
所有的PV按数量5-15个组成若干组RSS,每个RSS类似一个普通RAID的冗余组,但这个冗余组又不等同于常规RAID。常规RAID是基于磁盘的RAID算法,而RSS是基于PP的RAID算法。
为提高性能,EVA会有倾向地轮流分配不同的RSS,RSS之间的数据存储是基于JBOD的,每个RSS组成stripe的成员其实是不同PV中不同位置的PP。
无论RSS中成员数量有多少个,对于VRAID5,一个stripe中的PV数总是5个。对于VRAID6,一个stripe中的PV数总是6个。对于VRAID5,EVA会尽可能在N个磁盘中做C(N,5)的组合情况,以期实现IO负载均衡。
当一个RSS中某个PV离线,控制器会从同一个RSS中其他磁盘中寻找可用的PP,在逻辑上实现每个stripe的rebuild,从而保证整个存储的安全性。
当一个RSS中损坏的磁盘数量足够少时(少于等于6个),这个RSS的安全性就非常低了。这时候,EVA会合并此RSS到另一个RSS中,这样可用的冗余空间就是共享的了,空间就可以从另一个较安全的RSS中迁移过来。
为了保证有足够的空间提供冗余保护,在创建DISK GROUP时,EVA会提供一个Protection Level的保护级别。single表示用2个磁盘的空间做冗余 ,double表示用4个磁盘的空间做冗余。
这个冗余不同于hotspare,这个冗余空间仅会预留到每个PV的尾部。一则,多个磁盘,IO会更均匀,更快;二则,尾部的空间通常是质量较差的空间。

EVA存储常见故障:
1、RSS中多个磁盘掉线,超过冗余保护级别。
2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障。
3、VDISK被删除或EVA初始化。
4、突发性主机与存储无法连接。无法discover存储。

EVA存储数据恢复原理:
EVA系列存储最核心的结构部分来自于所有vdisk的运算pp map表,这个pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此map进行恢复。
当pp map不存在时,根据不同的条带之间的冗余关系,通过优化算法对所有PP进行条带性集合,形成若干组正确的条带数据,再基于文件系统结构、数据结构等特征,重组若干条带。

EVA存储数据恢复过程:
1、将EVA存储主机一端的连线拔出,直接连入主机hba卡上,就可以识别到所有物理硬盘。
2、对EVA存储中的磁盘做只读镜像。因EVA主机与扩展柜之间多是铜线连接,可能需要在扩展柜上增加光纤收发模块,再通过光链路接入fc hba卡上。也可以把所有硬盘拆下来后,放入其他光纤通道柜中进行镜像。
使用EVA扩展柜进行镜像的连接图:
002.jpg

3、通过frombyte recovery for hp eva程序重组vdisk,直接写入成镜像文件或目标物理磁盘。
4、按常规方式解释镜像文件或目标磁盘,迁移镜像或导出内部文件。

相关文章
|
1月前
|
存储 运维 数据挖掘
服务器数据恢复—EqualLogic存储硬盘出现坏道的数据恢复案例
某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层划分多个大小不同的卷,存放虚拟机文件。 硬盘出现故障导致存储阵列不可用,需要恢复存储阵列中的数据。
|
1月前
|
存储 运维 Oracle
服务器数据恢复—存储硬盘指示灯亮黄灯,RAID5阵列崩溃的数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组raid5阵列有27块硬盘,存放Oracle数据库文件。存储系统上层一共划分了11个卷。 服务器存储故障: 存储设备上两个硬盘指示灯亮黄色。其中一组RAID5阵列崩溃,存储不可用,设备已经过保。
|
1月前
|
存储 运维 数据挖掘
服务器数据恢复—Raid5阵列2块硬盘损坏,热备盘未激活的数据恢复
EMC存储上有一组由多块stat硬盘组建的raid5磁盘阵列,该raid5阵列中有两块热备盘。上层采用的是zfs文件系统。 raid5阵列中2块硬盘出现故障,只有一块热备盘激活。
|
2月前
|
Unix 应用服务中间件 索引
服务器数据恢复—LUN映射出错导致文件系统共享冲突的数据恢复案例
SUN光纤存储系统中有一组由6个硬盘组建的RAID6,划分为若干LUN,MAP到跑不同业务的服务器上,这些服务器上运行的是SOLARIS操作系统。 服务器不存在物理故障。由于公司业务变化,需要增加一台服务器跑新的应用。服务器管理员在原服务器在线的状态下,将其中一个lun映射到一台新服务器上。实际上,这个刚映射过去的卷已经map到了solaris生产系统上的某个lun上了。映射到新服务器后,服务器对这个卷进行初始化的操作,原solaris系统上的磁盘报错,重启服务器后这个卷已经无法挂载。 服务器管理员寻求sun原厂工程师的帮助。sun工程师检测后执行了fsck操作。执行完成后文件系统挂载成功。查
|
1月前
|
存储 SQL 关系型数据库
服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复
某单位同友存储,存储中有一组raid5磁盘阵列。存储内部共有虚拟机若干台,raid5阵列崩溃导致存储无法启动。
|
2月前
|
存储 数据挖掘 Linux
服务器数据恢复—重装系统导致OceanStor存储上的分区无法访问的数据恢复案例
服务器存储数据恢复环境: 华为OceanStor某型号存储+扩展盘柜,存储中的硬盘组建了raid5磁盘阵列,上层分配了1个lun。 linux操作系统,划分了两个分区,分区一通过lvm扩容,分区二为xfs文件系统。 服务器存储故障: 工作人员重装系统操作失误导致磁盘分区变化,分区二无法访问,数据丢失。
|
2月前
|
存储 数据挖掘 Windows
服务器数据恢复—RAIDZ上层ZFS文件系统数据恢复案例
一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管理员重启服务器,但是服务器无法进入系统。管理员联系北亚企安数据恢复工程师要求恢复服务器数据。
|
2月前
|
存储
服务器数据恢复—服务器断电导致数据丢失的数据恢复案例
某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现服务器无法正常工作。 根据描述的故障发生过程,北亚企安数据恢复工程师推断故障是意外断电导致raid模块损坏。
|
3月前
|
存储 监控 Linux
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
Dell OpenManage Enterprise 4.5 - Dell 服务器、存储和网络设备集中管理软件
93 0
|
1月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
206 10

热门文章

最新文章