服务器数据恢复—华为OceanStor存储数据恢复案例

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
简介: 服务器数据恢复环境:华为OceanStor某型号存储,存储内有一组由24块硬盘组建的raid5阵列,配置1块热备盘。服务器故障:该存储raid5阵列中有一块硬盘离线,热备盘自动激活并开始同步数据,在热备盘同步数据的过程中,raid5阵列中另一块硬盘离线,上层应用崩溃,数据丢失。

服务器数据恢复环境:
华为OceanStor某型号存储,存储内有一组由24块硬盘组建的raid5阵列,配置1块热备盘。

服务器故障:
该存储raid5阵列中有一块硬盘离线,热备盘自动激活并开始同步数据,在热备盘同步数据的过程中,raid5阵列中另一块硬盘离线,上层应用崩溃,数据丢失。

服务器数据恢复过程:
1、将该存储中所有硬盘编号后取出,硬件工程师对所有硬盘进行硬件故障检测,经过检测发现raid5中只有1块硬盘存在硬件故障,其他硬盘可正常读取。将完好硬盘以只读方式进行全盘镜像,镜像完成后按照编号将所有磁盘还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
由于本案例所使用的raid控制器对磁盘检测策略比较严格,通常会将无物理故障但性能不稳定的硬盘识别为坏盘并踢出raid阵列。之前硬件工程师只检测到一块硬盘有物理故障,另外一块掉线盘应该是因为读写不稳定被踢出阵列掉线。
2.、基于镜像文件分析每块硬盘的底层数据,获取到条带大小、数据走向、盘序、热备盘、数据库的分布规律等raid相关信息。根据获取到的raid5相关信息虚拟重组raid5阵列。
3、在重组raid5阵列的过程中发现有一块硬盘在相同条带上的数据与其他硬盘的明显不同,该硬盘进行条带校验后确认该硬盘被同步破坏。
4、重组raid5阵列后,数据恢复工程师分析lun在raid5阵列中的分配情况及数据块map。将map提取出来后通过北亚企安自研数据恢复程序解析&恢复lun数据。
5、北亚企安数据恢复工程师编写文件系统解析程序对虚拟重组出来的raid5阵列中的文件系统进行解析,导出数据库文件后交由数据库工程师进行校验和修复。
6、数据库工程师对数据库文件进行验证后发现部分数据库文件和日志文件异常,表空间内存在大量坏块,所有控制文件被破坏,undotbs02丢失。数据库工程师对数据库文件进行修复。
数据库文件修复过程:
01副本.jpg
02副本.jpg
7、经过数据库工程师对数据库文件的修复和验证,终于成功恢复数据库数据。数据恢复工程师将修复好的数据库数据导入准备好的环境中进行验证,经过验证所有数据均正常。用户方工程师对数据进行验证也没有发现异常。本次服务器数据恢复工作完成。

相关文章
|
6天前
|
数据挖掘
服务器数据恢复—服务器raid5阵列中2块硬盘掉线的数据恢复案例
某公司一台服务器,服务器上有一组由8块硬盘组建的raid5磁盘阵列。 磁盘阵列中2块硬盘的指示灯显示异常,其他硬盘指示灯显示正常。上层应用不可用。
|
1天前
|
存储 弹性计算 安全
阿里云服务器付费类型、地域、镜像、存储、带宽和安全组设置与选择注意事项参考
在我们通过自定义购买的方式购买阿里云服务器器ECS时,会有多个选项,有的新手用户可能并不是很清楚这些选项是什么,选择或设置时需要注意什么,本文将从付费类型、地域与可用区、镜像、存储、带宽和安全组等多个方面,为您详细解析云服务器购买过程中各个参数与配置的选择注意事项,以供参考。
|
4天前
|
存储 运维
服务器数据恢复—服务器raid5阵列中硬盘离线的数据恢复案例
某公司一台服务器中有一组多块硬盘组成的磁盘阵列。磁盘阵列中有2块硬盘出现故障离线,服务器崩溃,上层数据丢失。
|
1月前
|
存储 SQL 关系型数据库
服务器数据恢复—云服务器上mysql数据库数据恢复案例
某ECS网站服务器,linux操作系统+mysql数据库。mysql数据库采用innodb作为默认存储引擎。 在执行数据库版本更新测试时,操作人员误误将在本来应该在测试库执行的sql脚本在生产库上执行,导致生产库上部分表被truncate,还有部分表中少量数据被delete。
67 25
|
11天前
|
存储 运维 数据挖掘
服务器数据恢复—服务器raid5阵列硬盘出现坏道掉线的数据恢复案例
一台服务器中有一组由16块SAS接口的硬盘组建的raid5阵列。 服务器磁盘阵列中有2块硬盘离线,服务器上跑的应用崩溃。 经过后续的分析发现丢失的数据为虚拟机文件,包含4个卷的数据。
|
2月前
|
数据挖掘 数据库
服务器数据恢复—Zfs文件系统下误删除数据的恢复案例
服务器数据恢复环境&故障: 一台zfs文件系统的服务器,管理员误操作删除了服务器上的数据。
|
2月前
|
存储 数据挖掘 数据库
服务器数据恢复—EMC UNITY 400存储卷被误删除的数据恢复案例
EMC Unity 400存储连接了2台硬盘柜。2台硬盘柜上一共有21块硬盘(520字节)。21块盘组建了2组RAID6:一组有11块硬盘,一组有10块硬盘。 在存储运行过程中,管理员误操作删除了 2组POOL上的部分数据卷。
|
2天前
|
弹性计算 运维 监控
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
52 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
|
3天前
|
弹性计算 Linux 数据安全/隐私保护
阿里云幻兽帕鲁联机服务器搭建全攻略,速来抄作业!2025新版教程
阿里云提供2025年最新幻兽帕鲁服务器申请购买及一键开服教程。4核16G配置支持8人,70元/月;8核32G配置支持20人,160元/月。选择配置、地域、操作系统后,点击【一键购买及部署】,约3分钟完成创建。本地安装STEAM客户端并登录,进入游戏选择多人模式,输入服务器IP和端口(8211),即可开始游戏。详细教程及更多问题解答请参考阿里云幻兽帕鲁游戏专区。
44 20
|
2天前
|
存储 人工智能 运维
阿里云操作系统控制台——解决服务器磁盘I/O故障
阿里云操作系统控制台——解决服务器磁盘I/O故障
29 12

相关产品

  • 云服务器 ECS