【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例

简介: 客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。

一:案例描述

客户向我们反馈他们的华为OceanStor Dorado存储系统RAID-TP故障,导致数据丢失,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)RAID-TP介绍

RAID(冗余独立磁盘阵列)是一种用于提高数据可靠性和性能的存储技术。其中,RAID-TP是一种较新的RAID级别,特别针对闪存存储系统设计。它在RAID-6的基础上,增加了一个校验盘,从而实现了更高级别的数据保护。RAID-TP阵列由三部分组成:数据磁盘、校验磁盘和转换磁盘:

数据磁盘:数据磁盘是存储主要数据的磁盘;

校验磁盘:校验磁盘用于存储数据磁盘中数据的校验信息,如果数据磁盘损坏,可以通过校验磁盘来恢复数据;

转换磁盘:转换磁盘用于存储数据磁盘和校验磁盘之间的转换信息,以提高数据恢复的效率。

2)RAID-TP的工作原理

数据写入:当数据写入RAID-TP阵列时,数据被切分为多个块,这些块被平均写入到各个数据磁盘中。同时,系统会对这些数据块进行校验,生成校验信息,并将校验信息写入到校验磁盘中。此外,系统还会根据数据块和校验信息生成转换信息,并将转换信息写入到转换磁盘中;

数据读取:当读取数据时,系统会从数据磁盘中读取数据块,然后根据转换信息从校验磁盘中获取校验信息,以此来校验读取的数据是否正确。

2.恢复方案

华为OceanStor Dorado V6存储系统采用动态RAID技术实现冗余设计,根据RAID中检验位的个数不同提供不同的保护级别。存储系统提供3种保护级别,RAID 5、RAID 6和RAID-TP。RAID-TP自动校验的数据恢复过程,如果数据磁盘损坏,系统可以通过以下步骤恢复数据:

1)系统首先从校验磁盘中读取校验信息,然后根据转换信息,计算出损坏的数据块;

2)然后系统将恢复的数据块写入到新的数据磁盘中,完成数据的恢复。

目前没有可以支持RAID-TP的数据恢复软件,可以根据以下结构进行自定义RAID重组:


三:案例总结

华为OceanStor Dorado V6存储系统采用动态RAID重构技术(也称缩列重构技术),重构粒度为CK。即存储池总的可用硬盘小于RAID成员盘数,缩列重构时保持M(校验列)不变,减少N(数据列)的方式进行重构,重构前后RAID校验列数不变,数据列数变少。缩列重构完成后,RAID组成员盘数减少,但是RAID冗余级别不变。当故障盘更换完成后,系统会根据存储池内的可用硬盘数,增加N(数据列),新写数据就会采用新的RAID方式,故障期间写的数据也会逐渐转换为新的RAID方式。

相关文章
|
7天前
|
存储 运维 数据挖掘
服务器数据恢复—华为OceanStor存储数据恢复案例
服务器存储数据恢复环境: 华为品牌型号为OceanStor S2600T的存储设备,存储上有一组由24块4T容量的机械硬盘组建的RAID5阵列,作为存储池使用。 图1 服务器存储故障&检测: 存储设备中raid5阵列上多块硬盘出现故障离线,raid5阵列失效,数据无法正常访问。 关机后将存储中所有硬盘标记&取出,硬件工程师对所有硬盘进行硬件故障检测。经过检测,没有发现存在物理故障的磁盘,都可以正常读取。
|
8天前
|
存储 Linux
服务器数据恢复——使用fsck后Ext4文件系统挂载不上的数据恢复案例
关于Ext4文件系统的几个概念: 块组:Ext4文件系统的全部空间被划分为若干个块组,每个块组结构基本上相同。 块组描述符表:每个块组都对应一个块组描述符,这些块组描述符统一放在文件系统的前部,称为块组描述符表。每个块组描述符大小为32字节,主要描述块位图、i-节点位图及i-节点表的地址等信息。 超级块(Superblock):用于存储文件系统的配置参数(块大小、总块数、i-节点数等)和动态信息(当前空闲块数和i-节点数)。Ext4文件系统的超级块始于1024字节处,即2号扇区。 i节点:描述文件的时间、大小、块指针等信息。
|
3天前
|
数据挖掘 数据库 Windows
服务器数据恢复—服务器raid5阵列硬盘指示灯亮红色的数据恢复案例
服务器数据恢复环境: 某品牌DL380服务器,服务器中三块SAS硬盘组建了一组raid5阵列。服务器安装Windows Server操作系统,划分了3个分区,D分区存放数据库,E分区存放数据库备份。 服务器故障: RAID5阵列中有一块磁盘出现故障,该硬盘对应的指示灯亮红色。RAID5阵列瘫痪,D分区不可识别,E分区虽然可以识别,但是拷贝备份文件报错。管理员重启服务器,RAID5阵列上离线的硬盘自动上线开始同步数据。同步还没有完成时管理员强制关机,之后再没有动过服务器。
|
5天前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
|
7天前
|
存储 分布式计算 固态存储
阿里云2核16G、4核32G、8核64G配置云服务器租用收费标准与活动价格参考
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择。目前2核16G配置按量收费最低收费标准为0.54元/小时,按月租用标准收费标准为260.44元/1个月。4核32G配置的阿里云服务器按量收费标准最低为1.08元/小时,按月租用标准收费标准为520.88元/1个月。8核64G配置的阿里云服务器按量收费标准最低为2.17元/小时,按月租用标准收费标准为1041.77元/1个月。本文介绍这些配置的最新租用收费标准与活动价格情况,以供参考。
|
5天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
|
13天前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
51 9
|
10天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。
|
13天前
|
弹性计算 异构计算
2024年阿里云GPU服务器多少钱1小时?亲测价格查询方法
2024年阿里云GPU服务器每小时收费因实例规格不同而异。可通过阿里云GPU服务器页面选择“按量付费”查看具体价格。例如,NVIDIA A100的gn7e实例为34.742元/小时,NVIDIA A10的gn7i实例为12.710156元/小时。更多详情请访问阿里云官网。
54 2
|
19天前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
60 3