服务器数据恢复—EVA存储介绍&常见故障和数据恢复-阿里云开发者社区

服务器数据恢复—EVA存储介绍&常见故障和数据恢复

2024-07-17 422

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： EVA存储常见故障：1、RSS中多个磁盘掉线，超过冗余保护级别。2、加入新磁盘，进行数据迁移时，新磁盘存在物理故障。3、VDISK被删除或EVA初始化。4、突发性主机与存储无法连接。无法discover存储。

EVA存储介绍：
EVA存储是以虚拟化存储为实现目的的存储设备，内部的结构完全不同于普通的基于RAID的存储。EVA内部称之为VRAID。
EVA对每个物理磁盘(PV)进行签名(写在每个磁盘的0扇区)，签名后即分配到不同的DISK GROUP。
在DISK GROUP中，每个PV会按一定大小划分为若干存储单元(PP)，PP的大小为2的整数次幂，且应该在2-16M之间。
每个PV中有一定数量的PP，这些PP结合起来形成整个DISK GROUP的可用空间。

所有的PV按数量5-15个组成若干组RSS，每个RSS类似一个普通RAID的冗余组，但这个冗余组又不等同于常规RAID。常规RAID是基于磁盘的RAID算法，而RSS是基于PP的RAID算法。
为提高性能，EVA会有倾向地轮流分配不同的RSS，RSS之间的数据存储是基于JBOD的，每个RSS组成stripe的成员其实是不同PV中不同位置的PP。
无论RSS中成员数量有多少个，对于VRAID5，一个stripe中的PV数总是5个。对于VRAID6，一个stripe中的PV数总是6个。对于VRAID5，EVA会尽可能在N个磁盘中做C(N,5)的组合情况，以期实现IO负载均衡。
当一个RSS中某个PV离线，控制器会从同一个RSS中其他磁盘中寻找可用的PP，在逻辑上实现每个stripe的rebuild，从而保证整个存储的安全性。
当一个RSS中损坏的磁盘数量足够少时(少于等于6个)，这个RSS的安全性就非常低了。这时候，EVA会合并此RSS到另一个RSS中，这样可用的冗余空间就是共享的了，空间就可以从另一个较安全的RSS中迁移过来。
为了保证有足够的空间提供冗余保护，在创建DISK GROUP时，EVA会提供一个Protection Level的保护级别。single表示用2个磁盘的空间做冗余，double表示用4个磁盘的空间做冗余。
这个冗余不同于hotspare，这个冗余空间仅会预留到每个PV的尾部。一则，多个磁盘，IO会更均匀，更快；二则，尾部的空间通常是质量较差的空间。

EVA存储常见故障：
1、RSS中多个磁盘掉线，超过冗余保护级别。
2、加入新磁盘，进行数据迁移时，新磁盘存在物理故障。
3、VDISK被删除或EVA初始化。
4、突发性主机与存储无法连接。无法discover存储。

EVA存储数据恢复原理：
EVA系列存储最核心的结构部分来自于所有vdisk的运算pp map表，这个pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此map进行恢复。
当pp map不存在时，根据不同的条带之间的冗余关系，通过优化算法对所有PP进行条带性集合，形成若干组正确的条带数据，再基于文件系统结构、数据结构等特征，重组若干条带。

EVA存储数据恢复过程:
1、将EVA存储主机一端的连线拔出，直接连入主机hba卡上，就可以识别到所有物理硬盘。
2、对EVA存储中的磁盘做只读镜像。因EVA主机与扩展柜之间多是铜线连接，可能需要在扩展柜上增加光纤收发模块，再通过光链路接入fc hba卡上。也可以把所有硬盘拆下来后，放入其他光纤通道柜中进行镜像。
使用EVA扩展柜进行镜像的连接图：

3、通过frombyte recovery for hp eva程序重组vdisk，直接写入成镜像文件或目标物理磁盘。
4、按常规方式解释镜像文件或目标磁盘，迁移镜像或导出内部文件。

服务器数据恢复—EVA存储介绍&常见故障和数据恢复

计算巢

热门文章

最新文章

相关课程

相关电子书