服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例

本文涉及的产品
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,1个月黄金款+200核时
简介: 昆腾某型号存储,StorNext文件存储系统。共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。

服务器数据恢复环境:
昆腾某型号存储,StorNext文件存储系统。
共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。
存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。
存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。

服务器故障:
存放普通数据的其中一个存储系统中的一组RAID5阵列有2块硬盘先后出现故障离线,该RAID5阵列不可用,从而导致该阵列所在的存储系统崩溃,无法使用。
昆腾存储及StorNext文件系统架构:
1副本.jpg
注:Meta_LUN(元数据卷)) Data_LUN(用户数据卷)

服务器数据恢复过程:
1、将磁盘柜中出现故障的raid5阵列中的所有磁盘编号后取出,由硬件工程师进行检测,除了发现其中一块离线硬盘存在大量的坏道,没有发现其他磁盘存在明显的硬件故障。将完好的硬盘以只读方式进行扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原磁盘柜中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
针对存在大量的坏道的磁盘,由硬件工程师开盘更换固件,更换固件能正常读取后使用专业工具进行修复,虽然坏道仍然存在,但是可以备份。
部分镜像文件:
2副本.jpg

2、基于镜像文件对故障RAID5阵列底层数据进行分析,获取到该RAID5相关信息,利用获取到的信息虚拟重组RAID5阵列,重组完成后将RAID5阵列中的LUN恢复成镜像文件。在分析过程中,发现损坏较严重的硬盘为后离线的硬盘,就是此硬盘存在大量坏道。
3、登录昆腾存储设备的管理界面,获取到StorNext文件系统中和卷相关的一些基本信息。
3副本.jpg

4、分析StorNext文件系统中的Meta卷和Data卷,经过分析发现该StorNext文件系统包含2个Data卷,每一个完整的Data卷是由多组RAID阵列中的LUN组成的,通过分析这些LUN,北亚企安数据恢复工程师研究出LUN之间组合的算法规律,然后虚拟重组出完整的Data卷。
4副本.jpg

5、分析Meta卷中的节点信息、目录项信息、Meta卷和Data卷之间的对应关系,针对一个Meta卷管理多个Data卷的情况,北亚企安数据恢复工程师研究出Meta卷到Data卷的索引算法。
文件节点:
5副本.jpg

目录块:
6副本.jpg

6、通过上述步骤的分析&研究,获取到了数据恢复工作所需要的全部信息。北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,通过解析目录项和节点获取完整的文件系统目录结构。解析每一个节点中的指针信息并将这些信息记录在数据库中。
文件信息:
7副本.jpg

7、北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法提取数据。
8、随机抽样检测提取出来的数据,没有发现任何问题。由用户方工程师对恢复出来的数据进行验证,验证完成后用户方认可恢复结果。
9、将恢复出来的数据迁移到用户方准备好的环境中,再次验证没有问题。本次数据恢复工作完成。

相关文章
|
3天前
|
存储 数据挖掘 数据库
服务器数据恢复—OceanStor存储数据恢复案例
华为OceanStor T系列某型号存储中有一组由24块机械硬盘组建的一组RAID5阵列。 运行过程中该存储设备RAID5阵列上多块硬盘出现故障离线,阵列失效,存储中数据无法访问。
|
1天前
|
存储 数据挖掘
服务器数据恢复—zfs文件系统服务器数据恢复案例
一台配有32块硬盘的服务器在运行过程中突然崩溃不可用。经过初步检测,基本上确定服务器硬件不存在物理故障。管理员重启服务器后问题依旧。需要恢复该服务器中的数据。
|
9天前
|
运维 数据挖掘 索引
服务器数据恢复—Lustre分布式文件系统服务器数据恢复案例
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。 机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。
|
3天前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
2天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
|
10天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
9天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
17天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
18天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
21天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)

相关产品

  • 云服务器 ECS