【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例

简介: 客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。

一:案例描述

客户向我们反馈他们的华为OceanStor Dorado存储系统RAID-TP故障,导致数据丢失,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)RAID-TP介绍

RAID(冗余独立磁盘阵列)是一种用于提高数据可靠性和性能的存储技术。其中,RAID-TP是一种较新的RAID级别,特别针对闪存存储系统设计。它在RAID-6的基础上,增加了一个校验盘,从而实现了更高级别的数据保护。RAID-TP阵列由三部分组成:数据磁盘、校验磁盘和转换磁盘:

数据磁盘:数据磁盘是存储主要数据的磁盘;

校验磁盘:校验磁盘用于存储数据磁盘中数据的校验信息,如果数据磁盘损坏,可以通过校验磁盘来恢复数据;

转换磁盘:转换磁盘用于存储数据磁盘和校验磁盘之间的转换信息,以提高数据恢复的效率。

2)RAID-TP的工作原理

数据写入:当数据写入RAID-TP阵列时,数据被切分为多个块,这些块被平均写入到各个数据磁盘中。同时,系统会对这些数据块进行校验,生成校验信息,并将校验信息写入到校验磁盘中。此外,系统还会根据数据块和校验信息生成转换信息,并将转换信息写入到转换磁盘中;

数据读取:当读取数据时,系统会从数据磁盘中读取数据块,然后根据转换信息从校验磁盘中获取校验信息,以此来校验读取的数据是否正确。

2.恢复方案

华为OceanStor Dorado V6存储系统采用动态RAID技术实现冗余设计,根据RAID中检验位的个数不同提供不同的保护级别。存储系统提供3种保护级别,RAID 5、RAID 6和RAID-TP。RAID-TP自动校验的数据恢复过程,如果数据磁盘损坏,系统可以通过以下步骤恢复数据:

1)系统首先从校验磁盘中读取校验信息,然后根据转换信息,计算出损坏的数据块;

2)然后系统将恢复的数据块写入到新的数据磁盘中,完成数据的恢复。

目前没有可以支持RAID-TP的数据恢复软件,可以根据以下结构进行自定义RAID重组:


三:案例总结

华为OceanStor Dorado V6存储系统采用动态RAID重构技术(也称缩列重构技术),重构粒度为CK。即存储池总的可用硬盘小于RAID成员盘数,缩列重构时保持M(校验列)不变,减少N(数据列)的方式进行重构,重构前后RAID校验列数不变,数据列数变少。缩列重构完成后,RAID组成员盘数减少,但是RAID冗余级别不变。当故障盘更换完成后,系统会根据存储池内的可用硬盘数,增加N(数据列),新写数据就会采用新的RAID方式,故障期间写的数据也会逐渐转换为新的RAID方式。

相关文章
|
8天前
|
存储 数据挖掘 数据库
服务器数据恢复—raid磁盘故障导致数据库数据损坏的数据恢复案例
存储中有一组由3块SAS硬盘组建的raid。上层win server操作系统层面划分了3个分区,数据库存放在D分区,备份存放在E分区。 RAID中一块硬盘的指示灯亮红色,D分区无法识别;E分区可识别,但是拷贝文件报错。管理员重启服务器,导致离线的硬盘上线开始同步数据,同步还没有完成就直接强制关机了,之后就没有动过服务器。
|
9天前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
62 5
|
13天前
|
JavaScript 前端开发
vue配合axios连接express搭建的node服务器接口_简单案例
文章介绍了如何使用Express框架搭建一个简单的Node服务器,并使用Vue结合Axios进行前端开发和接口调用,同时讨论了开发过程中遇到的跨域问题及其解决方案。
13 0
vue配合axios连接express搭建的node服务器接口_简单案例
|
10天前
|
网络协议 Windows
[收藏]优化基于Win 2000系统的Web服务器性能
[收藏]优化基于Win 2000系统的Web服务器性能
|
10天前
|
存储 Oracle 关系型数据库
服务器数据恢复—存储硬盘故障导致映射到服务器上的卷挂载不上的数据恢复案例
一台存储上有一组由16块FC硬盘组建了一组raid。存储前面板上的对应10号和13号硬盘的故障灯亮起,存储映射到redhat linux操作系统服务器上的卷挂载不上,业务中断。
|
10天前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN环境下LUN Mapping出错导致文件系统共享冲突的数据恢复案例
服务器数据恢复环境: SAN环境下一台存储设备中有一组由6块硬盘组建的RAID6磁盘阵列,划分若干LUN,MAP到不同业务的SOLARIS操作系统服务器上。 服务器故障: 用户新增了一台服务器,将存储中的某个LUN映射到新增加的这台服务器上。这个映射的LUN其实之前已经MAP到其他SOLARIS操作系统的服务器上了。由于没有及时发现问题,新增加的这台服务器已经对此LUN做了初始化操作,磁盘报错,重启后发现卷无法挂载。
|
27天前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
25天前
|
编解码 前端开发 安全
通过阿里云的活动购买云服务器时如何选择实例、带宽、云盘
在我们选购阿里云服务器的过程中,不管是新用户还是老用户通常都是通过阿里云的活动去买了,一是价格更加实惠,二是活动中的云服务器配置比较丰富,足可以满足大部分用户的需求,但是面对琳琅满目的云服务器实例、带宽和云盘选项,如何选择更适合自己,成为许多用户比较关注的问题。本文将介绍如何在阿里云的活动中选择合适的云服务器实例、带宽和云盘,以供参考和选择。
通过阿里云的活动购买云服务器时如何选择实例、带宽、云盘
|
23天前
|
弹性计算 运维 安全
阿里云轻量应用服务器和经济型e实例区别及选择参考
目前在阿里云的活动中,轻量应用服务器2核2G3M带宽价格为82元1年,2核2G3M带宽的经济型e实例云服务器价格99元1年,对于云服务器配置和性能要求不是很高的阿里云用户来说,这两款服务器配置和价格都差不多,阿里云轻量应用服务器和ECS云服务器让用户二选一,很多用户不清楚如何选择,本文来说说轻量应用服务器和经济型e实例的区别及选择参考。
阿里云轻量应用服务器和经济型e实例区别及选择参考
|
24天前
|
机器学习/深度学习 存储 人工智能
阿里云GPU云服务器实例规格gn6v、gn7i、gn6i实例性能及区别和选择参考
阿里云的GPU云服务器产品线在深度学习、科学计算、图形渲染等多个领域展现出强大的计算能力和广泛的应用价值。本文将详细介绍阿里云GPU云服务器中的gn6v、gn7i、gn6i三个实例规格族的性能特点、区别及选择参考,帮助用户根据自身需求选择合适的GPU云服务器实例。
阿里云GPU云服务器实例规格gn6v、gn7i、gn6i实例性能及区别和选择参考
下一篇
无影云桌面