服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 昆腾某型号存储,StorNext文件存储系统。共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。

服务器数据恢复环境:
昆腾某型号存储,StorNext文件存储系统。
共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。
存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。
存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。

服务器故障:
存放普通数据的其中一个存储系统中的一组RAID5阵列有2块硬盘先后出现故障离线,该RAID5阵列不可用,从而导致该阵列所在的存储系统崩溃,无法使用。
昆腾存储及StorNext文件系统架构:
1副本.jpg
注:Meta_LUN(元数据卷)) Data_LUN(用户数据卷)

服务器数据恢复过程:
1、将磁盘柜中出现故障的raid5阵列中的所有磁盘编号后取出,由硬件工程师进行检测,除了发现其中一块离线硬盘存在大量的坏道,没有发现其他磁盘存在明显的硬件故障。将完好的硬盘以只读方式进行扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原磁盘柜中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
针对存在大量的坏道的磁盘,由硬件工程师开盘更换固件,更换固件能正常读取后使用专业工具进行修复,虽然坏道仍然存在,但是可以备份。
部分镜像文件:
2副本.jpg

2、基于镜像文件对故障RAID5阵列底层数据进行分析,获取到该RAID5相关信息,利用获取到的信息虚拟重组RAID5阵列,重组完成后将RAID5阵列中的LUN恢复成镜像文件。在分析过程中,发现损坏较严重的硬盘为后离线的硬盘,就是此硬盘存在大量坏道。
3、登录昆腾存储设备的管理界面,获取到StorNext文件系统中和卷相关的一些基本信息。
3副本.jpg

4、分析StorNext文件系统中的Meta卷和Data卷,经过分析发现该StorNext文件系统包含2个Data卷,每一个完整的Data卷是由多组RAID阵列中的LUN组成的,通过分析这些LUN,北亚企安数据恢复工程师研究出LUN之间组合的算法规律,然后虚拟重组出完整的Data卷。
4副本.jpg

5、分析Meta卷中的节点信息、目录项信息、Meta卷和Data卷之间的对应关系,针对一个Meta卷管理多个Data卷的情况,北亚企安数据恢复工程师研究出Meta卷到Data卷的索引算法。
文件节点:
5副本.jpg

目录块:
6副本.jpg

6、通过上述步骤的分析&研究,获取到了数据恢复工作所需要的全部信息。北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,通过解析目录项和节点获取完整的文件系统目录结构。解析每一个节点中的指针信息并将这些信息记录在数据库中。
文件信息:
7副本.jpg

7、北亚企安数据恢复工程师编写文件提取程序读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法提取数据。
8、随机抽样检测提取出来的数据,没有发现任何问题。由用户方工程师对恢复出来的数据进行验证,验证完成后用户方认可恢复结果。
9、将恢复出来的数据迁移到用户方准备好的环境中,再次验证没有问题。本次数据恢复工作完成。

相关文章
|
6天前
|
存储 算法 数据挖掘
服务器数据恢复—昆腾存储StorNext文件系统数据恢复案例
服务器数据恢复环境: 昆腾某型号存储,8个存放数据的存储柜+1个存放元数据的存储柜。 元数据存储:8组RAID1阵列+1组RAID10阵列+4个全局热备硬盘。 数据存储:32组RAID5阵列,划分2个存储系统。 服务器故障: 数据存储的1个存储系统中的一组RAID5阵列中有2块硬盘先后出现故障离线,导致该RAID5阵列失效,整个存储系统崩溃不可用。
服务器数据恢复—昆腾存储StorNext文件系统数据恢复案例
|
1月前
|
存储 机器学习/深度学习 弹性计算
ecs实例规格存储和I/O需求
阿里云ECS提供多种实例类型满足不同需求:通用型适合中小型应用;计算型强调CPU性能,适合大数据分析;存储型针对高I/O场景,如数据库;内存型适合内存敏感应用;GPU型用于GPU加速任务;异构计算型包含FPGA、ASIC。实例搭配不同性能的云盘(如ESSD)以调整IOPS和吞吐量。选择实例时,需综合考虑应用对计算、内存和存储I/O的需求。
15 1
|
1月前
|
存储 数据挖掘 Windows
服务器数据恢复—异常断电导致raid信息丢失的数据恢复案例
由于机房多次断电导致一台服务器中raid阵列信息丢失。该阵列中存放的是文档,上层安装的是Windows server操作系统,没有配置ups。 因为服务器异常断电重启后,raid阵列可以正常使用,所以未引起管理员的注意。后续出现的多次异常断电导致raid报错,服务器无法找到存储设备,进入raid管理模块进行任何操作都会导致操作系统死机。管理员尝试多次重启服务器,故障依旧。
|
1月前
|
Ubuntu JavaScript 关系型数据库
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
在阿里云Ubuntu 20.04服务器上部署Ghost博客的步骤包括创建新用户、安装Nginx、MySQL和Node.js 18.x。首先,通过`adduser`命令创建非root用户,然后安装Nginx和MySQL。接着,设置Node.js环境,下载Nodesource GPG密钥并安装Node.js 18.x。之后,使用`npm`安装Ghost-CLI,创建Ghost安装目录并进行安装。配置过程中需提供博客URL、数据库连接信息等。最后,测试访问前台首页和后台管理页面。确保DNS设置正确,并根据提示完成Ghost博客的配置。
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
|
1月前
|
存储 弹性计算 数据可视化
要将ECS中的文件直接传输到阿里云网盘与相册(
【2月更文挑战第31天】要将ECS中的文件直接传输到阿里云网盘与相册(
420 4
|
1月前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
23天前
|
弹性计算
阿里云ECS使用体验
在申请高校学生免费体验阿里云ECS云服务器后的一些使用体验和感受。
|
1月前
|
弹性计算
阿里云3M带宽云服务器并发多大?阿里云3M带宽云服务器测评参考
在探讨云服务器3M带宽能支持多大并发这一问题时,我们首先要明白一个关键点:并发量并非仅由带宽决定,还与网站本身的大小密切相关。一般来说,一个优化良好的普通网站页面大小可能只有几K,为便于计算,我们可以暂且假定每个页面大小为50K。
823 1
|
19小时前
|
网络协议 Serverless 应用服务中间件
Serverless 应用引擎操作报错合集之在阿里云函数计算中,服务器调用FC函数时出现 "[Errno -3] Temporary failure in name resolution)" 错误如何解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
11 4
|
3天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线

相关产品

  • 云服务器 ECS