【服务器数据恢复】同友存储数raid5崩溃的据恢复案例

简介: 服务器数据恢复环境:一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要数据。服务器故障:同友存储上的raid5阵列崩溃导致存储无法启动。

服务器数据恢复环境:
一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要数据。

服务器故障:
同友存储上的raid5阵列崩溃导致存储无法启动。

服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出,由硬件工程师检测硬件故障,发现有一块盘盘片划伤,其他磁盘没有发现明显的硬件故障。将完好磁盘以只读方式做扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、与用户方进行沟通后,北亚企安数据恢复工程师基于镜像文件查看所有磁盘底层情况,分析本案例中存储结构。
存储结构:
1副本.jpg

3、根据分析底层数据获取到的raid5相关信息重组raid5阵列。重组过程中发现本案例中的raid5缺失2块盘(第一掉线盘掉线后由热备盘顶替,之后第二块盘掉线导致RAID5处于降级状态,第三块盘盘片划伤掉线导致RAID崩溃),无法直接获通过校验获取到丢失盘的数据,只能使用与磁盘同等大小的全0镜像进行重组(此方法除了紧急情况慎用。依赖空镜像组建raid,文件系统结构会严重破坏,相当于每个条带都会缺失两个块的数据)。
重建raid:
2副本.jpg
4、分析存储结构,获取存储划分的MAP块。解析MAP块得到各个LUN的数据块指针。北亚企安数据恢复工程师编写数据提取程序提取LUN碎片,提取完成后拼接碎片&组成完整LUN。
提取LUN:
3副本.jpg
5、导出虚拟机后尝试启动,和预计的情况一样:由于操作系统被破坏,虚拟机无法启动。
6、在虚拟机无法启动的情况下提取虚拟机内文件。提取虚拟机内的文件后进行测试,发现大多数文件都被破坏,只有少部分小文件可以打开。
7、与用户方进行沟通后得知有一台虚拟机内有mysql数据库,可以利用mysql数据库存储特殊性,通过扫描数据页提取数据。找到这台有mysql数据库的虚拟机,发现该虚拟机启用了快照。在父盘和快照文件都损坏的情况下,常规合并无法完成,使用北亚企安自主研发VMFS快照合并程序进行快照合并。
4副本.jpg

8、根据mysql数据页特征扫描&导出数据页(仅采用innodb引擎的mysql数据库可以使用此方案),分析系统表获取各用户表信息,根据各个表的id分割数据页。
9、该mysql数据库在长时间的使用过程中曾多次变更表结构,而且存储损坏后系统表有部分数据丢失,导致记录提取困难。首先获取最初版本mysql数据库各个表的表结构:合并快照前的父盘因为写入较早,通过使用第一块掉线盘进行校验来获取到这个文件的完整数据,然后提取出数据库各个表的表结构。和用户沟通后,用户方提供了最新版本数据库的建表脚本。
10、分别使用最初版本mysql数据库的表结构和最新版本mysql数据库的表结构提取数据记录,并导入到恢复环境中的mysql数据库内。剔除各个表中因为表结构变更而出现的乱码数据,将两组数据分别导出为.sql文件。
11、因为两个版本的mysql数据库表结构不同,由用户方应用工程师进行调试后导入平台,平台调试成功。本次服务器数据恢复工作完成。

相关文章
|
3天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
12天前
|
安全 数据挖掘
服务器数据恢复—RAID5阵列中两块硬盘离线导致阵列崩溃的数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘未知原因离线,热备盘自动激活上线替换离线硬盘。在热备盘上线过程中,raid5阵列中又有一块硬盘离线。热备盘同步失败,该raid阵列崩溃,LVM结构变得不完整,文件系统无法正常使用。
|
17天前
|
存储 监控 调度
云服务器成本优化深度解析与实战案例
本文深入探讨了云服务器成本优化的策略与实践,涵盖基本原则、具体策略及案例分析。基本原则包括以实际需求为导向、动态调整资源、成本控制为核心。具体策略涉及选择合适计费模式、优化资源配置、存储与网络配置、实施资源监控与审计、应用性能优化、利用优惠政策及考虑多云策略。文章还通过电商、制造企业和初创团队的实际案例,展示了云服务器成本优化的有效性,最后展望了未来的发展趋势,包括智能化优化、多云管理和绿色节能。
|
4天前
|
存储 数据挖掘
服务器数据恢复—ZFS文件系统下数据恢复案例
服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32块硬盘。32块硬盘分为4组,每组8块硬盘,共组建了3组RAIDZ,每组raid都配置了热备盘。 服务器存储故障: 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储,系统无法进入,需要恢复服务器存储中的数据。
|
19天前
|
存储 Oracle 关系型数据库
服务器数据恢复—华为S5300存储Oracle数据库恢复案例
服务器存储数据恢复环境: 华为S5300存储中有12块FC硬盘,其中11块硬盘作为数据盘组建了一组RAID5阵列,剩下的1块硬盘作为热备盘使用。基于RAID的LUN分配给linux操作系统使用,存放的数据主要是Oracle数据库。 服务器存储故障: RAID5阵列中1块硬盘出现故障离线,热备盘自动激活开始同步数据,在同步数据的过程中又一块硬盘离线,RAID5阵列瘫痪,上层LUN无法使用。
|
6天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
7天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
10天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)
|
27天前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
47 6
|
4天前
|
机器学习/深度学习 人工智能 编解码
阿里云GPU云服务器优惠收费标准,GPU服务器优缺点与适用场景详解
随着人工智能、大数据分析和高性能计算的发展,对计算资源的需求不断增加。GPU凭借强大的并行计算能力和高效的浮点运算性能,逐渐成为处理复杂计算任务的首选工具。阿里云提供了从入门级到旗舰级的多种GPU服务器,涵盖GN5、GN6、GN7、GN8和GN9系列,分别适用于图形渲染、视频编码、深度学习推理、训练和高性能计算等场景。本文详细介绍各系列的规格、价格和适用场景,帮助用户根据实际需求选择最合适的GPU实例。

热门文章

最新文章

相关产品

  • 云服务器 ECS