【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例

简介: 客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。

一:案例描述

客户向我们反馈他们的华为OceanStor Dorado存储系统RAID-TP故障,导致数据丢失,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)RAID-TP介绍

RAID(冗余独立磁盘阵列)是一种用于提高数据可靠性和性能的存储技术。其中,RAID-TP是一种较新的RAID级别,特别针对闪存存储系统设计。它在RAID-6的基础上,增加了一个校验盘,从而实现了更高级别的数据保护。RAID-TP阵列由三部分组成:数据磁盘、校验磁盘和转换磁盘:

数据磁盘:数据磁盘是存储主要数据的磁盘;

校验磁盘:校验磁盘用于存储数据磁盘中数据的校验信息,如果数据磁盘损坏,可以通过校验磁盘来恢复数据;

转换磁盘:转换磁盘用于存储数据磁盘和校验磁盘之间的转换信息,以提高数据恢复的效率。

2)RAID-TP的工作原理

数据写入:当数据写入RAID-TP阵列时,数据被切分为多个块,这些块被平均写入到各个数据磁盘中。同时,系统会对这些数据块进行校验,生成校验信息,并将校验信息写入到校验磁盘中。此外,系统还会根据数据块和校验信息生成转换信息,并将转换信息写入到转换磁盘中;

数据读取:当读取数据时,系统会从数据磁盘中读取数据块,然后根据转换信息从校验磁盘中获取校验信息,以此来校验读取的数据是否正确。

2.恢复方案

华为OceanStor Dorado V6存储系统采用动态RAID技术实现冗余设计,根据RAID中检验位的个数不同提供不同的保护级别。存储系统提供3种保护级别,RAID 5、RAID 6和RAID-TP。RAID-TP自动校验的数据恢复过程,如果数据磁盘损坏,系统可以通过以下步骤恢复数据:

1)系统首先从校验磁盘中读取校验信息,然后根据转换信息,计算出损坏的数据块;

2)然后系统将恢复的数据块写入到新的数据磁盘中,完成数据的恢复。

目前没有可以支持RAID-TP的数据恢复软件,可以根据以下结构进行自定义RAID重组:


三:案例总结

华为OceanStor Dorado V6存储系统采用动态RAID重构技术(也称缩列重构技术),重构粒度为CK。即存储池总的可用硬盘小于RAID成员盘数,缩列重构时保持M(校验列)不变,减少N(数据列)的方式进行重构,重构前后RAID校验列数不变,数据列数变少。缩列重构完成后,RAID组成员盘数减少,但是RAID冗余级别不变。当故障盘更换完成后,系统会根据存储池内的可用硬盘数,增加N(数据列),新写数据就会采用新的RAID方式,故障期间写的数据也会逐渐转换为新的RAID方式。

相关文章
|
3天前
|
存储 Oracle 关系型数据库
服务器数据恢复—光纤存储上oracle数据库数据恢复案例
一台光纤服务器存储上有16块FC硬盘,上层部署了Oracle数据库。服务器存储前面板2个硬盘指示灯显示异常,存储映射到linux操作系统上的卷挂载不上,业务中断。 通过storage manager查看存储状态,发现逻辑卷状态失败。再查看物理磁盘状态,发现其中一块盘报告“警告”,硬盘指示灯显示异常的2块盘报告“失败”。 将当前存储的完整日志状态备份下来,解析备份出来的存储日志并获得了关于逻辑卷结构的部分信息。
|
1月前
|
存储 运维 API
HPE OneView 10.0 - HPE 服务器、存储和网络设备集中管理软件
HPE OneView 10.0 - HPE 服务器、存储和网络设备集中管理软件
44 1
|
24天前
|
数据挖掘
服务器数据恢复——服务器异常断电造成raid5阵列故障的数据恢复案例
某服务器上有一组由12块硬盘组建的raid5磁盘阵列。 机房供电不稳定导致机房中该服务器非正常断电,重启服务器后管理员发现服务器无法正常使用。 意外断电可能会导致服务器上的raid模块损坏。
|
1天前
|
Oracle 安全 关系型数据库
服务器数据恢复—热备盘未成功激活导致raid崩溃的数据恢复案例
一台服务器中有5块硬盘,其中的4块组建了一组RAID5阵列,剩下一块盘作为热备盘(Hot-Spare)使用。服务器操作系统为linux,应用系统为构架于oracle数据库的一个oa。 raid5阵列中一块盘离线,但热备盘未自动激活rebuild。直到另外一块盘离线,RAID崩溃。 由于oracle已经不再对本案例中的oa系统提供后续支持,用户方要求尽可能恢复数据和操作系统。经过检测发现热备盘完全没有启用,硬盘无明显物理故障,无明显同步表现。
|
1月前
|
存储 数据挖掘 数据库
服务器数据恢复—ocfs2文件系统数据恢复案例
服务器存储数据恢复环境&故障: 人为误操作将Ext4文件系统误装入一台服务器存储上的Ocfs2文件系统数据卷上,导致原Ocfs2文件系统被格式化为Ext4文件系统。
|
3天前
|
存储 弹性计算 数据挖掘
阿里云2核4G5M带宽199元云服务器测评:价格、性能、适用场景与续费优势详解
阿里云目前活动中推出的“2核4G5M带宽199元1年”云服务器,是当下深受初创企业用户喜爱的云服务器。本文将从价格优势、性能优势和续费优势等几个方面,详细解析这款阿里云199元云服务器的各项特点,帮助大家更好地了解这款云服务器的性能和应用场景,以供选择参考。
|
25天前
|
存储 运维 关系型数据库
阿里云国际服务器:全球企业数字化转型的云端基石
阿里云国际服务器提供高性能、高安全和全球化部署的云服务解决方案。其高效云盘具备单盘100万IOPS性能,9个9的数据可靠性,并采用三副本冗余存储确保数据安全。覆盖25个地域、80多个可用区的全球加速网络,大幅降低跨境访问延迟。阿里云已获50多项国际认证,支持企业合规出海。通过统一控制台管理多地域架构,助力企业提升效率、降低成本,是超过200个国家和地区企业的共同选择。
|
3月前
|
存储 缓存 弹性计算
阿里云经济型e实例云服务器评测:企业官网搭建的性价比之选
阿里云服务器经济型e实例可以用来搭建企业网站吗?云服务器作为搭建企业官网的基础设施,其性能、稳定性、成本等因素直接影响着官网的运营效果。阿里云经济型e实例云服务器作为一款性价比较高的产品,备受用户关注。许多企业在选择云服务器搭建官网时,都会将其纳入考虑范围。本文将详细探讨阿里云经济型e实例云服务器的特点、性能表现、稳定性与可靠性,以及成本考量,最终解答是否适合用它来搭建企业官网。
|
4月前
|
存储 缓存 网络协议
阿里云特惠云服务器99元与199元配置与性能和适用场景解析:高性价比之选
2025年,阿里云长效特惠活动继续推出两款极具吸引力的特惠云服务器套餐:99元1年的经济型e实例2核2G云服务器和199元1年的通用算力型u1实例2核4G云服务器。这两款云服务器不仅价格亲民,而且性能稳定可靠,为入门级用户和普通企业级用户提供了理想的选择。本文将对这两款云服务器进行深度剖析,包括配置介绍、实例规格、使用场景、性能表现以及购买策略等方面,帮助用户更好地了解这两款云服务器,以供参考和选择。

热门文章

最新文章