【服务器数据恢复】raid5多块硬盘离线导致昆腾存储崩溃的数据恢复案例

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 10个磁盘柜,每个磁盘柜配24块硬盘。9个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。元数据存储中24块硬盘,组建了9组RAID1阵列+1组RAID10阵列,4个全局热备硬盘。数据存储中,组建了36组6硬RAID5,36组RAID5阵列划分为2个存储系统。其中1个存储系统中的一组RAID5中有2块硬盘先后出现故障离线,RAID5阵列不可用,存储系统崩溃。

服务器数据恢复环境&故障:
10个磁盘柜,每个磁盘柜配24块硬盘。9个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。
元数据存储中24块硬盘,组建了9组RAID1阵列+1组RAID10阵列,4个全局热备硬盘。
数据存储中,组建了36组6硬RAID5,36组RAID5阵列划分为2个存储系统。其中1个存储系统中的一组RAID5中有2块硬盘先后出现故障离线,RAID5阵列不可用,存储系统崩溃。
存储及文件系统架构:
01副本.jpg
注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)

服务器数据恢复过程:
1、将故障RAID5中的6块盘编号标记后从磁盘柜中取出。经过硬件工程师检测,所有磁盘都可以正常读取。以只读方式对6块硬盘进行扇区级全盘镜像。对磁盘柜中没有出现故障的RAID阵列进行存储层面的备份。
备份示意图:
02副本.jpg

在镜像过程中发现故障RAID5阵列中的1块故障离线硬盘存在大量的坏道区域,无法继续备份。在用户方的授权下,将故障盘进行开盘更换固件并使用专业工具进行修复,修复完成后该硬盘可以继续备份,但坏道仍然存在。
部分镜像文件:
03副本.jpg

2、基于镜像文件对故障RAID5阵列所有磁盘中的底层数据进行分析,获取到重组RAID需要的相关信息,利用获取到的RAID信息虚拟重组RAID阵列,并将该RAID阵列中的LUN恢复成镜像文件。在分析过程中发现,存在大量坏道的硬盘为后离线的硬盘。
3、登陆昆腾存储的管理界面,读取StorNext文件系统中与卷相关的信息。
04副本.jpg

4、分析StorNext文件系统中的Meta卷和Data卷。每一个完整的Data卷都是由多组RAID中的LUN组成的,通过分析这些LUN获取到LUN之间组合的算法规律,虚拟重组出完整的Data卷。
05副本.jpg

5、分析Meta卷,分析Meta卷中的节点信息、目录项信息、Meta卷和Data卷之间的对应关系。针对一个Meta卷管理多个Data卷的情况,研究Meta卷到Data卷的索引算法。
文件节点:
06副本.jpg

目录块:
07副本.jpg

6、通过分析研究获取到了恢复数据所需要的全部信息,北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,同时通过对目录项和节点解析获取到完整的文件系统目录结构。解析每一个节点中的指针信息,将这些信息记录在数据库中。
文件信息:
08副本.jpg

7、北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出来的信息以及两个Data卷之间的聚合算法提取数据。
8、对提取出来的数据进行随机抽样检测,没有发现问题。将全部文件提取到本地,由用户方进行检测。经过仔细检测后,用户方认可数据恢复结果。本次数据恢复工作完成。

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3天前
|
存储 SQL 关系型数据库
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
某单位同友存储,存储设备中若干磁盘组建了raid5磁盘阵列。未知原因导致存储设备崩溃无法启动,raid5阵列上层的虚拟机全部丢失,其中存放了重要数据的3台虚拟机需要恢复。
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
|
4天前
|
运维 数据挖掘
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例
服务器中有一组由多块硬盘组建的raid5磁盘阵列,服务器阵列中2块硬盘先后掉线导致服务器崩溃。
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例
|
3天前
|
弹性计算 运维 监控
解密阿里云弹性计算:探索云服务器ECS的核心功能
阿里云ECS是核心计算服务,提供弹性云服务器资源,支持实例按需配置、集群管理和监控,集成安全防护,确保服务稳定、安全,助力高效业务运营。
15 0
|
12天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
123 6
|
14天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
3天前
|
负载均衡 固态存储 Linux
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
轻量应用服务器、云服务器、gpu云服务器是阿里云服务器产品中,比较热门的云服务器产品类型,不同类型的云服务器产品收费模式与收费标准是不一样的,本文为大家展示这几个云服务器产品的最新收费标准情况,以供参考。
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
|
3天前
|
弹性计算 负载均衡 容灾
应用阿里云弹性计算:打造高可用性云服务器ECS架构
阿里云弹性计算助力构建高可用云服务器ECS架构,通过实例分布、负载均衡、弹性IP、数据备份及多可用区部署,确保业务连续稳定。自动容错和迁移功能进一步增强容灾能力,提供全方位高可用保障。
13 0
|
3天前
|
存储 弹性计算 监控
探索阿里云弹性计算:如何优化云服务器ECS的性能与成本
在云时代,【阿里云ECS】的性能优化与成本控制至关重要。利用实例规格选择、自动伸缩、网络和存储配置,可增强性能、减少成本。结合监控工具和优化建议,用户能解决性能问题,提升应用稳定性,实现高效且经济的云计算运营。
9 1
|
4天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线
|
5天前
|
编解码 缓存 安全
阿里云目前活动内各云服务器实例规格适用场景与价格参考
目前阿里云的活动中,云服务器有多种不同实例规格可选,实例规格定义了实例的基本属性:CPU和内存(包括CPU型号、主频等),但是不同实例规格所适用的场景是不一样的,价格也有很大差别,有的用户初次选购阿里云服务器可能并不知道这些实例规格的具体适用场景,下面是小编整理汇总的2024年截止目前阿里云的活动中云服务器实例规格适用场景与活动价格,以供参考。
阿里云目前活动内各云服务器实例规格适用场景与价格参考

相关产品

  • 云服务器 ECS