服务器数据恢复—同友存储raid5磁盘阵列数据恢复案例

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
无影云电脑个人版,1个月黄金款+200核时
简介: 服务器数据恢复环境:某市教育局同友存储,存储中有一组由数块磁盘组建的raid5阵列,存储空间划分若干lun。每个lun中有若干台虚拟机,其中有数台linux操作系统的虚拟机为重要数据。服务器故障:raid崩溃导致存储无法启动。

服务器数据恢复环境:
某市教育局同友存储,存储中有一组由数块磁盘组建的raid5阵列,存储空间划分若干lun。每个lun中有若干台虚拟机,其中有数台linux操作系统的虚拟机为重要数据。
存储结构:
001.jpg

服务器故障:
raid崩溃导致存储无法启动。

服务器数据恢复流程:
1、将存储中所有磁盘编号后取出,由硬件工程师检测后没有发现有硬盘存在明显的硬件故障。以只读方式将所有磁盘进行扇区级全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据,获取重组raid所需要的相关信息,利用获取到的raid信息重组raid。在重组raid过程中发现该raid5缺失2块盘(还原存储raid崩溃的过程:第一块盘掉线后热备盘顶替,第二块盘掉线让RAID5处于降级状态,第三块盘掉线RAID崩溃),无法通过校验直接获取掉线盘的数据,只能使用与缺失磁盘同等大小的全0镜像进行重组(此方法只可用于紧急情况,通过全0镜像组建的raid结构会被严重破坏,相当于每个条带都会缺失两个块的数据)。
重建raid:
002.jpg

3、基于组建完成的raid分析存储结构,获取存储划分的MAP块。找到MAP块之后通过解析获取到各个LUN的数据块指针,北亚企安数据恢复工程师编写数据提取程序提取LUN碎片。碎片提取完成后通过拼接碎片组成完整LUN。
提取LUN:
003.jpg

4、导出LUN内所有虚拟机后尝试启动,由于操作系统被破坏,虚拟机无法成功启动。
5、由于虚拟机无法启动,数据恢复工程师只能对虚拟机内文件进行提取,对提取出的文件进行测试后发现大多数文件被破坏,只有少量的小文件可以打开。
虚拟机内取出的图片:
004.jpg

6、与用户方沟通后得知有虚拟机内有mysql数据库,基于数据库存储的特殊性,可以尝试通过扫描数据页来提取数据。找到这台有数据库的虚拟机后发现此虚拟机启用快照。在父盘和快照文件都被损坏的情况下,常规合并操作无法完成,尝试使用北亚企安自主研发VMFS快照合并程序进行快照合并。
005.jpg

7、根据mysql数据页特征扫描&导出数据页。分析系统表获取各用户表信息,根据各个表的id分割数据页。
8、由于数据库使表结构曾多次变更,系统表也有部分数据丢失,记录提取过程充满坎坷。首先获取最初版本数据库各个表的表结构:合并快照前的父盘因为写入较早,使用第一块掉线盘进行校验获取到这个文件的完整数据,然后提取出其中数据库各个表的表结构。用户方提供了最新版的数据库建表脚本。
9、分别使用两组不同表结构提取数据记录并导入恢复环境中的mysql数据库内,剔除各个表中因为表结构变更导致的乱码数据,最后将两组数据分别导出为.sql文件。
10、因为两个版本的数据库表结构不同,所以联系了用户方的应用工程师进行调试。调试完成后导入平台,经过用户方检测后确认绝大部分数据已经恢复出来,认可数据恢复结果。本次数据恢复工作完成。

相关文章
|
9天前
|
数据挖掘
服务器数据恢复—服务器raid5阵列中2块硬盘掉线的数据恢复案例
某公司一台服务器,服务器上有一组由8块硬盘组建的raid5磁盘阵列。 磁盘阵列中2块硬盘的指示灯显示异常,其他硬盘指示灯显示正常。上层应用不可用。
|
5天前
|
存储 弹性计算 安全
阿里云服务器付费类型、地域、镜像、存储、带宽和安全组设置与选择注意事项参考
在我们通过自定义购买的方式购买阿里云服务器器ECS时,会有多个选项,有的新手用户可能并不是很清楚这些选项是什么,选择或设置时需要注意什么,本文将从付费类型、地域与可用区、镜像、存储、带宽和安全组等多个方面,为您详细解析云服务器购买过程中各个参数与配置的选择注意事项,以供参考。
105 66
|
11天前
|
弹性计算 Ubuntu 网络安全
ECS磁盘使用率异常升高,BPS,IOPS飙升
我刚开了一个2C4G的ECS,运行Ubuntu 20.04,常出现无响应、SSH断开等问题。原因是未配置swap,导致内存过高时磁盘写入频繁。解决办法在文章里。
115 72
|
5天前
|
存储 人工智能 运维
阿里云操作系统控制台——解决服务器磁盘I/O故障
阿里云操作系统控制台——解决服务器磁盘I/O故障
33 12
|
7天前
|
存储 运维
服务器数据恢复—服务器raid5阵列中硬盘离线的数据恢复案例
某公司一台服务器中有一组多块硬盘组成的磁盘阵列。磁盘阵列中有2块硬盘出现故障离线,服务器崩溃,上层数据丢失。
|
11天前
|
弹性计算 固态存储 Linux
课时4:第4天:云服务器磁盘管理
欢迎收看玩转云服务器ECS系列课程,今天我们来学习第四课:云服务器磁盘的管理。这课有三个小节。 1. 磁盘有什么用 2. 磁盘分区与挂载 3. 扩容磁盘
|
5天前
|
弹性计算 运维 监控
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
62 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
|
2天前
|
人工智能 运维 数据可视化
玩转云服务器——阿里云操作系统控制台体验测评
在云服务器日益普及的背景下,运维人员对操作系统管理工具的要求不断提高。我们需要一款既能直观展示系统状态,又能智能诊断问题,提供专业指导的控制台。阿里云操作系统管理平台正是基于API、SDK、CLI等多种管理方式,致力于提升操作效率,为用户带来全新的系统运维体验。阿里云操作系统控制台凭借便捷易用的设计和高效的管理功能,成为云服务器运维的强力助手。本次测评基于真实体验截图,对其整体表现进行了深入探索。
53 33
|
6天前
|
弹性计算 Linux 数据安全/隐私保护
阿里云幻兽帕鲁联机服务器搭建全攻略,速来抄作业!2025新版教程
阿里云提供2025年最新幻兽帕鲁服务器申请购买及一键开服教程。4核16G配置支持8人,70元/月;8核32G配置支持20人,160元/月。选择配置、地域、操作系统后,点击【一键购买及部署】,约3分钟完成创建。本地安装STEAM客户端并登录,进入游戏选择多人模式,输入服务器IP和端口(8211),即可开始游戏。详细教程及更多问题解答请参考阿里云幻兽帕鲁游戏专区。
50 20
|
8天前
|
弹性计算 数据可视化 Linux
阿里云操作系统控制台——ECS操作与性能优化
本文详细介绍如何操作阿里云服务器ECS,从开通到组件安装及内存诊断。首先,通过选择操作系统(如Alibaba Cloud Linux 3)并开通服务,创建RAM用户并授予权限。接着,安装所需组件,支持节点或集群安装。最后,利用内存全景诊断功能,输入实例ID或Pod名称发起诊断并解析结果。这一流程帮助用户高效搭建计算环境,提升技术能力,确保业务稳定运行,并提出优化建议以改善用户体验。
59 8

相关产品

  • 云服务器 ECS