【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例

简介: 客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。

一:案例描述

客户向我们反馈他们的华为OceanStor Dorado存储系统RAID-TP故障,导致数据丢失,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)RAID-TP介绍

RAID(冗余独立磁盘阵列)是一种用于提高数据可靠性和性能的存储技术。其中,RAID-TP是一种较新的RAID级别,特别针对闪存存储系统设计。它在RAID-6的基础上,增加了一个校验盘,从而实现了更高级别的数据保护。RAID-TP阵列由三部分组成:数据磁盘、校验磁盘和转换磁盘:

数据磁盘:数据磁盘是存储主要数据的磁盘;

校验磁盘:校验磁盘用于存储数据磁盘中数据的校验信息,如果数据磁盘损坏,可以通过校验磁盘来恢复数据;

转换磁盘:转换磁盘用于存储数据磁盘和校验磁盘之间的转换信息,以提高数据恢复的效率。

2)RAID-TP的工作原理

数据写入:当数据写入RAID-TP阵列时,数据被切分为多个块,这些块被平均写入到各个数据磁盘中。同时,系统会对这些数据块进行校验,生成校验信息,并将校验信息写入到校验磁盘中。此外,系统还会根据数据块和校验信息生成转换信息,并将转换信息写入到转换磁盘中;

数据读取:当读取数据时,系统会从数据磁盘中读取数据块,然后根据转换信息从校验磁盘中获取校验信息,以此来校验读取的数据是否正确。

2.恢复方案

华为OceanStor Dorado V6存储系统采用动态RAID技术实现冗余设计,根据RAID中检验位的个数不同提供不同的保护级别。存储系统提供3种保护级别,RAID 5、RAID 6和RAID-TP。RAID-TP自动校验的数据恢复过程,如果数据磁盘损坏,系统可以通过以下步骤恢复数据:

1)系统首先从校验磁盘中读取校验信息,然后根据转换信息,计算出损坏的数据块;

2)然后系统将恢复的数据块写入到新的数据磁盘中,完成数据的恢复。

目前没有可以支持RAID-TP的数据恢复软件,可以根据以下结构进行自定义RAID重组:


三:案例总结

华为OceanStor Dorado V6存储系统采用动态RAID重构技术(也称缩列重构技术),重构粒度为CK。即存储池总的可用硬盘小于RAID成员盘数,缩列重构时保持M(校验列)不变,减少N(数据列)的方式进行重构,重构前后RAID校验列数不变,数据列数变少。缩列重构完成后,RAID组成员盘数减少,但是RAID冗余级别不变。当故障盘更换完成后,系统会根据存储池内的可用硬盘数,增加N(数据列),新写数据就会采用新的RAID方式,故障期间写的数据也会逐渐转换为新的RAID方式。

相关文章
|
30天前
|
存储 运维 数据挖掘
服务器数据恢复—EqualLogic存储硬盘出现坏道的数据恢复案例
某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层划分多个大小不同的卷,存放虚拟机文件。 硬盘出现故障导致存储阵列不可用,需要恢复存储阵列中的数据。
|
1月前
|
存储 运维 Oracle
服务器数据恢复—存储硬盘指示灯亮黄灯,RAID5阵列崩溃的数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组raid5阵列有27块硬盘,存放Oracle数据库文件。存储系统上层一共划分了11个卷。 服务器存储故障: 存储设备上两个硬盘指示灯亮黄色。其中一组RAID5阵列崩溃,存储不可用,设备已经过保。
|
1月前
|
存储 运维 数据挖掘
服务器数据恢复—Raid5阵列2块硬盘损坏,热备盘未激活的数据恢复
EMC存储上有一组由多块stat硬盘组建的raid5磁盘阵列,该raid5阵列中有两块热备盘。上层采用的是zfs文件系统。 raid5阵列中2块硬盘出现故障,只有一块热备盘激活。
|
2月前
|
Unix 应用服务中间件 索引
服务器数据恢复—LUN映射出错导致文件系统共享冲突的数据恢复案例
SUN光纤存储系统中有一组由6个硬盘组建的RAID6,划分为若干LUN,MAP到跑不同业务的服务器上,这些服务器上运行的是SOLARIS操作系统。 服务器不存在物理故障。由于公司业务变化,需要增加一台服务器跑新的应用。服务器管理员在原服务器在线的状态下,将其中一个lun映射到一台新服务器上。实际上,这个刚映射过去的卷已经map到了solaris生产系统上的某个lun上了。映射到新服务器后,服务器对这个卷进行初始化的操作,原solaris系统上的磁盘报错,重启服务器后这个卷已经无法挂载。 服务器管理员寻求sun原厂工程师的帮助。sun工程师检测后执行了fsck操作。执行完成后文件系统挂载成功。查
|
1月前
|
存储 SQL 关系型数据库
服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复
某单位同友存储,存储中有一组raid5磁盘阵列。存储内部共有虚拟机若干台,raid5阵列崩溃导致存储无法启动。
|
29天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
201 10
|
27天前
|
运维 安全 Ubuntu
阿里云渠道商:服务器操作系统怎么选?
阿里云提供丰富操作系统镜像,涵盖Windows与主流Linux发行版。选型需综合技术兼容性、运维成本、安全稳定等因素。推荐Alibaba Cloud Linux、Ubuntu等用于Web与容器场景,Windows Server支撑.NET应用。建议优先选用LTS版本并进行测试验证,通过标准化镜像管理提升部署效率与一致性。
|
1月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
308 8
|
28天前
|
存储 监控 安全
阿里云渠道商:云服务器价格有什么变动?
阿里云带宽与存储费用呈基础资源降价、增值服务差异化趋势。企业应结合业务特点,通过阶梯计价、智能分层、弹性带宽等策略优化成本,借助云监控与预算预警机制,实现高效、可控的云资源管理。
|
29天前
|
弹性计算 运维 安全
区别及选择指南:阿里云轻量应用服务器与ECS云服务器有什么区别?
阿里云轻量应用服务器适合个人开发者、学生搭建博客、测试环境,易用且性价比高;ECS功能更强大,适合企业级应用如大数据、高流量网站。根据需求选择:轻量入门首选,ECS专业之选。
193 2