服务器数据恢复—EVA存储介绍&常见故障和数据恢复

简介: EVA存储常见故障:1、RSS中多个磁盘掉线,超过冗余保护级别。2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障。3、VDISK被删除或EVA初始化。4、突发性主机与存储无法连接。无法discover存储。

EVA存储介绍:
EVA存储是以虚拟化存储为实现目的的存储设备,内部的结构完全不同于普通的基于RAID的存储。EVA内部称之为VRAID。
EVA对每个物理磁盘(PV)进行签名(写在每个磁盘的0扇区),签名后即分配到不同的DISK GROUP。
在DISK GROUP中,每个PV会按一定大小划分为若干存储单元(PP),PP的大小为2的整数次幂,且应该在2-16M之间。
每个PV中有一定数量的PP,这些PP结合起来形成整个DISK GROUP的可用空间。
001.jpg
所有的PV按数量5-15个组成若干组RSS,每个RSS类似一个普通RAID的冗余组,但这个冗余组又不等同于常规RAID。常规RAID是基于磁盘的RAID算法,而RSS是基于PP的RAID算法。
为提高性能,EVA会有倾向地轮流分配不同的RSS,RSS之间的数据存储是基于JBOD的,每个RSS组成stripe的成员其实是不同PV中不同位置的PP。
无论RSS中成员数量有多少个,对于VRAID5,一个stripe中的PV数总是5个。对于VRAID6,一个stripe中的PV数总是6个。对于VRAID5,EVA会尽可能在N个磁盘中做C(N,5)的组合情况,以期实现IO负载均衡。
当一个RSS中某个PV离线,控制器会从同一个RSS中其他磁盘中寻找可用的PP,在逻辑上实现每个stripe的rebuild,从而保证整个存储的安全性。
当一个RSS中损坏的磁盘数量足够少时(少于等于6个),这个RSS的安全性就非常低了。这时候,EVA会合并此RSS到另一个RSS中,这样可用的冗余空间就是共享的了,空间就可以从另一个较安全的RSS中迁移过来。
为了保证有足够的空间提供冗余保护,在创建DISK GROUP时,EVA会提供一个Protection Level的保护级别。single表示用2个磁盘的空间做冗余 ,double表示用4个磁盘的空间做冗余。
这个冗余不同于hotspare,这个冗余空间仅会预留到每个PV的尾部。一则,多个磁盘,IO会更均匀,更快;二则,尾部的空间通常是质量较差的空间。

EVA存储常见故障:
1、RSS中多个磁盘掉线,超过冗余保护级别。
2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障。
3、VDISK被删除或EVA初始化。
4、突发性主机与存储无法连接。无法discover存储。

EVA存储数据恢复原理:
EVA系列存储最核心的结构部分来自于所有vdisk的运算pp map表,这个pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此map进行恢复。
当pp map不存在时,根据不同的条带之间的冗余关系,通过优化算法对所有PP进行条带性集合,形成若干组正确的条带数据,再基于文件系统结构、数据结构等特征,重组若干条带。

EVA存储数据恢复过程:
1、将EVA存储主机一端的连线拔出,直接连入主机hba卡上,就可以识别到所有物理硬盘。
2、对EVA存储中的磁盘做只读镜像。因EVA主机与扩展柜之间多是铜线连接,可能需要在扩展柜上增加光纤收发模块,再通过光链路接入fc hba卡上。也可以把所有硬盘拆下来后,放入其他光纤通道柜中进行镜像。
使用EVA扩展柜进行镜像的连接图:
002.jpg

3、通过frombyte recovery for hp eva程序重组vdisk,直接写入成镜像文件或目标物理磁盘。
4、按常规方式解释镜像文件或目标磁盘,迁移镜像或导出内部文件。

相关文章
|
3天前
|
Oracle 关系型数据库 数据挖掘
服务器数据恢复—服务器RAID5磁盘阵列数据恢复案例
服务器数据恢复环境: 一台服务器上有一组由5块硬盘(4块数据盘+1块热备盘)组建的raid5阵列。服务器安装Linux Redhat操作系统,运行一套基于oracle数据库的OA系统。 服务器故障: 这组raid5阵列中一块磁盘离线,但是热备盘并没有自动激活rebuild,当另外一块数据盘发生故障离线后,raid崩溃。 用户方要求恢复raid数据,同时要求还原操作系统。经过初步观察,raid中的这些硬盘没有表现出存在明显的物理故障的特征,也没有明显的同步表现,数据恢复的可能性很大。
|
7天前
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
5天前
|
存储
服务器数据恢复—EMC存储RAID5阵列崩溃的数据恢复案例
服务器数据恢复环境: 一台EMC某型号存储设备,该存储中有一组由12块(包括2块热备盘)STAT硬盘组建的raid5阵列。 服务器故障: 该存储在运行过程中突然崩溃,raid瘫痪。数据恢复工程师到达现场对故障存储设备进行初检,发现raid中有两块硬盘掉线但只有一块热备盘成功激活,所以导致阵列瘫痪,上层lun无法使用。
|
2天前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
5天前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
12 2
|
3天前
|
存储 Oracle 关系型数据库
服务器数据恢复—V7000存储NTFS文件系统分区数据恢复案例
服务器存储数据恢复环境: 一台挂载在Windows server服务器上的v7000存储。存储空间划分了一个分区,采用NTFS文件系统,存放oracle数据库。 服务器存储故障: 服务器在运行过程中宕机,于是管理员重启服务器。服务器进入系统自动进行磁盘扫描修复时,管理员强制关机并断开了存储和服务器之间的连接,导致这台存储上的文件系统损坏,报错“文件或目录损坏且无法读取”。
|
1天前
|
网络协议 应用服务中间件 网络安全
阿里云轻量应用服务器的使用限制
阿里云轻量应用服务器的使用限制
|
3天前
阿里云国际版购买了服务器后如何下载发票?
阿里云国际版购买了服务器后如何下载发票?
|
5天前
|
弹性计算 Linux 数据库
阿里云国际版如何迁移Linux云服务器系统盘中的数据
阿里云国际版如何迁移Linux云服务器系统盘中的数据
|
5天前
|
弹性计算 网络协议 Ubuntu
如何在阿里云国际版Linux云服务器中自定义配置DNS
如何在阿里云国际版Linux云服务器中自定义配置DNS