【服务器数据恢复】同友存储数raid5崩溃的据恢复案例

本文涉及的产品
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
简介: 服务器数据恢复环境:一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要数据。服务器故障:同友存储上的raid5阵列崩溃导致存储无法启动。

服务器数据恢复环境:
一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要数据。

服务器故障:
同友存储上的raid5阵列崩溃导致存储无法启动。

服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出,由硬件工程师检测硬件故障,发现有一块盘盘片划伤,其他磁盘没有发现明显的硬件故障。将完好磁盘以只读方式做扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、与用户方进行沟通后,北亚企安数据恢复工程师基于镜像文件查看所有磁盘底层情况,分析本案例中存储结构。
存储结构:
1副本.jpg

3、根据分析底层数据获取到的raid5相关信息重组raid5阵列。重组过程中发现本案例中的raid5缺失2块盘(第一掉线盘掉线后由热备盘顶替,之后第二块盘掉线导致RAID5处于降级状态,第三块盘盘片划伤掉线导致RAID崩溃),无法直接获通过校验获取到丢失盘的数据,只能使用与磁盘同等大小的全0镜像进行重组(此方法除了紧急情况慎用。依赖空镜像组建raid,文件系统结构会严重破坏,相当于每个条带都会缺失两个块的数据)。
重建raid:
2副本.jpg
4、分析存储结构,获取存储划分的MAP块。解析MAP块得到各个LUN的数据块指针。北亚企安数据恢复工程师编写数据提取程序提取LUN碎片,提取完成后拼接碎片&组成完整LUN。
提取LUN:
3副本.jpg
5、导出虚拟机后尝试启动,和预计的情况一样:由于操作系统被破坏,虚拟机无法启动。
6、在虚拟机无法启动的情况下提取虚拟机内文件。提取虚拟机内的文件后进行测试,发现大多数文件都被破坏,只有少部分小文件可以打开。
7、与用户方进行沟通后得知有一台虚拟机内有mysql数据库,可以利用mysql数据库存储特殊性,通过扫描数据页提取数据。找到这台有mysql数据库的虚拟机,发现该虚拟机启用了快照。在父盘和快照文件都损坏的情况下,常规合并无法完成,使用北亚企安自主研发VMFS快照合并程序进行快照合并。
4副本.jpg

8、根据mysql数据页特征扫描&导出数据页(仅采用innodb引擎的mysql数据库可以使用此方案),分析系统表获取各用户表信息,根据各个表的id分割数据页。
9、该mysql数据库在长时间的使用过程中曾多次变更表结构,而且存储损坏后系统表有部分数据丢失,导致记录提取困难。首先获取最初版本mysql数据库各个表的表结构:合并快照前的父盘因为写入较早,通过使用第一块掉线盘进行校验来获取到这个文件的完整数据,然后提取出数据库各个表的表结构。和用户沟通后,用户方提供了最新版本数据库的建表脚本。
10、分别使用最初版本mysql数据库的表结构和最新版本mysql数据库的表结构提取数据记录,并导入到恢复环境中的mysql数据库内。剔除各个表中因为表结构变更而出现的乱码数据,将两组数据分别导出为.sql文件。
11、因为两个版本的mysql数据库表结构不同,由用户方应用工程师进行调试后导入平台,平台调试成功。本次服务器数据恢复工作完成。

相关文章
|
9天前
|
数据挖掘
服务器数据恢复—服务器raid5阵列中2块硬盘掉线的数据恢复案例
某公司一台服务器,服务器上有一组由8块硬盘组建的raid5磁盘阵列。 磁盘阵列中2块硬盘的指示灯显示异常,其他硬盘指示灯显示正常。上层应用不可用。
|
3天前
|
Ubuntu 应用服务中间件 网络安全
Nginx伪流媒体服务器搭建详细说明以及案例
Nginx伪流媒体服务器搭建步骤如下:1. 安装Nginx,根据系统选择命令;2. 编辑配置文件(/etc/nginx/nginx.conf),添加mp4相关设置;3. 创建视频目录/usr/share/nginx/html/videos并上传视频;4. 重启Nginx应用更改;5. 通过浏览器访问视频,如http://your_server_ip/videos/example.mp4。注意启用mp4模块,确保视频格式支持伪流媒体播放。
|
8天前
|
存储 运维
服务器数据恢复—服务器raid5阵列中硬盘离线的数据恢复案例
某公司一台服务器中有一组多块硬盘组成的磁盘阵列。磁盘阵列中有2块硬盘出现故障离线,服务器崩溃,上层数据丢失。
|
1月前
|
存储 机器学习/深度学习 人工智能
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
|
6天前
|
弹性计算 运维 监控
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
63 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
|
2天前
|
人工智能 运维 数据可视化
玩转云服务器——阿里云操作系统控制台体验测评
在云服务器日益普及的背景下,运维人员对操作系统管理工具的要求不断提高。我们需要一款既能直观展示系统状态,又能智能诊断问题,提供专业指导的控制台。阿里云操作系统管理平台正是基于API、SDK、CLI等多种管理方式,致力于提升操作效率,为用户带来全新的系统运维体验。阿里云操作系统控制台凭借便捷易用的设计和高效的管理功能,成为云服务器运维的强力助手。本次测评基于真实体验截图,对其整体表现进行了深入探索。
53 33
|
7天前
|
弹性计算 Linux 数据安全/隐私保护
阿里云幻兽帕鲁联机服务器搭建全攻略,速来抄作业!2025新版教程
阿里云提供2025年最新幻兽帕鲁服务器申请购买及一键开服教程。4核16G配置支持8人,70元/月;8核32G配置支持20人,160元/月。选择配置、地域、操作系统后,点击【一键购买及部署】,约3分钟完成创建。本地安装STEAM客户端并登录,进入游戏选择多人模式,输入服务器IP和端口(8211),即可开始游戏。详细教程及更多问题解答请参考阿里云幻兽帕鲁游戏专区。
51 20
|
5天前
|
存储 人工智能 运维
阿里云操作系统控制台——解决服务器磁盘I/O故障
阿里云操作系统控制台——解决服务器磁盘I/O故障
33 12
|
9天前
|
弹性计算 数据可视化 Linux
阿里云操作系统控制台——ECS操作与性能优化
本文详细介绍如何操作阿里云服务器ECS,从开通到组件安装及内存诊断。首先,通过选择操作系统(如Alibaba Cloud Linux 3)并开通服务,创建RAM用户并授予权限。接着,安装所需组件,支持节点或集群安装。最后,利用内存全景诊断功能,输入实例ID或Pod名称发起诊断并解析结果。这一流程帮助用户高效搭建计算环境,提升技术能力,确保业务稳定运行,并提出优化建议以改善用户体验。
59 8
|
4天前
|
存储 运维 监控
深度体验阿里云系统控制台:SysOM 让 Linux 服务器监控变得如此简单
作为一名经历过无数个凌晨三点被服务器报警电话惊醒的运维工程师,我对监控工具有着近乎苛刻的要求。记得去年那次大型活动,我们的主站流量暴增,服务器内存莫名其妙地飙升到90%以上,却找不到原因。如果当时有一款像阿里云 SysOM 这样直观的监控工具,也许我就不用熬通宵排查问题了。今天,我想分享一下我使用 SysOM 的亲身体验,特别是它那令人印象深刻的内存诊断功能。

相关产品

  • 云服务器 ECS