服务器数据恢复—异常断电导致RAID5阵列信息丢失的数据恢复案例

本文涉及的产品
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,黄金款:40核时/1个月有效
简介: 服务器数据恢复环境:某品牌ProLiant DL380系列服务器,服务器中有一组由6块SAS硬盘组建的RAID5阵列,WINDOWS SERVER操作系统,作为企业内部文件服务器使用。服务器故障:机房供电几次意外中断,服务器出现故障前最后一次异常断电重启后RAID报错,提示无法找到存储设备,进入RAID管理模块做任何操作都死机,重启服务器后问题依旧,用户联系北亚企安数据恢复中心寻求帮助。

服务器数据恢复环境:
某品牌ProLiant DL380系列服务器,服务器中有一组由6块SAS硬盘组建的RAID5阵列,WINDOWS SERVER操作系统,作为企业内部文件服务器使用。

服务器故障:
机房供电几次意外中断,服务器出现故障前最后一次异常断电重启后RAID报错,提示无法找到存储设备,进入RAID管理模块做任何操作都死机,重启服务器后问题依旧,用户联系北亚企安数据恢复中心寻求帮助。
服务器意外断电导致RAID故障(包括RAID管理信息丢失和RAID硬件损坏)的情况并不少见。RAID创建完成后,RAID管理模块信息一般不会再发生改变,但RAID管理模块信息是可修改的信息,磁盘阵列意外断电也经常会导致RAID管理信息被篡改或者丢失。多次断电甚至有可能导致RAID卡元器件损坏,从而导致服务器失去对多块物理硬盘进行RAID管理的中间层模块。本案例中的故障表现如在RAID模块的任何操作都导致死机的现象就极有可能是RAID卡硬件损坏引起的(后经服务器厂家售后人员验证确实如此),如果是这种情况,通过常规方法已无法获取RAID5阵列中6块硬盘的数据,只能通过专业的数据恢复技术手段来恢复服务器的数据。

服务器数据恢复过程:
1、将故障服务器中所有磁盘编号后取出,由硬件工程师对6块SAS硬盘进行物理故障检测,检测结果是这6块硬盘读取状态良好,无明显的物理故障。
2、以只读方式将所有磁盘进行扇区级全盘镜像,镜像完成后按照编号将所有磁盘还原到故障服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件对原RAID5阵列的结构进行分析,获取盘序、数据块大小、校验方式等重组raid5阵列所需要的信息,根据获取到的信息重组RAID5阵列。
4、重组完成后对所RAID5阵列中的数据进行逻辑校验,在确保重组RAID所使用的参数正确无误后,针对用户所需要恢复的重要数据进行验证。
5、经过验证,用户确认恢复出来的数据完整有效,认可数据恢复结果。协助用户方将所有数据迁移至用户准备好的生产环境中。本次数据恢复工作完成。

服务器数据安全Tips:
1、尽最大可能保证机房供电稳定,减少供电异常对服务器及存储造成的破坏。
2、为重要的服务器及存储配备UPS,在意外断电的情况下能保证核心业务能继续维持一段时间的运行,为应急方案实施赢得时间。
3、定期对服务时间长的服务器进行安全状况检查,并对整体运行状态进行评估以决定是否进行硬件及系统的升级。
4、提前制定突发数据灾难的应急处理方案,降低数据灾难造成的损失。

相关文章
|
11天前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
12天前
|
Oracle 关系型数据库 数据挖掘
服务器数据恢复—服务器RAID5磁盘阵列数据恢复案例
服务器数据恢复环境: 一台服务器上有一组由5块硬盘(4块数据盘+1块热备盘)组建的raid5阵列。服务器安装Linux Redhat操作系统,运行一套基于oracle数据库的OA系统。 服务器故障: 这组raid5阵列中一块磁盘离线,但是热备盘并没有自动激活rebuild,当另外一块数据盘发生故障离线后,raid崩溃。 用户方要求恢复raid数据,同时要求还原操作系统。经过初步观察,raid中的这些硬盘没有表现出存在明显的物理故障的特征,也没有明显的同步表现,数据恢复的可能性很大。
|
15天前
|
存储
服务器数据恢复—EMC存储RAID5阵列崩溃的数据恢复案例
服务器数据恢复环境: 一台EMC某型号存储设备,该存储中有一组由12块(包括2块热备盘)STAT硬盘组建的raid5阵列。 服务器故障: 该存储在运行过程中突然崩溃,raid瘫痪。数据恢复工程师到达现场对故障存储设备进行初检,发现raid中有两块硬盘掉线但只有一块热备盘成功激活,所以导致阵列瘫痪,上层lun无法使用。
|
9天前
|
运维 Oracle 关系型数据库
服务器数据恢复—浪潮服务器硬盘出现坏道的数据恢复案例
服务器数据恢复环境: 一台浪潮服务器中有一组由6块SAS硬盘组建的RAID。服务器上划分了1个卷,存放Oracle数据库文件。 服务器故障&检测: 服务器上有两个硬盘指示灯亮黄灯,RAID崩溃,服务器不可用。 将故障服务器中所有磁盘标记后取出。由硬件工程师检测故障服务器上的取出的6块硬盘是否存在硬件故障,经过检测发现变黄的指示灯所对应的2块硬盘存在坏道且SMART的错误冗余级别已经超过阈值。
|
15天前
|
人工智能 运维 Kubernetes
87cloud案例分析:阿里云国际服务器如何支持在线教育
87cloud案例分析:阿里云国际服务器如何支持在线教育
|
2天前
|
存储 数据挖掘 Linux
服务器数据恢复—ext4文件系统服务器数据恢复案例
服务器数据恢复环境: 某品牌服务器+同品牌存储,Linux centos7+EXT4文件系统。 服务器故障: 意外断电导致服务器操作系统不能正常启动。经过修复后系统可以正常启动,但是挂载的分区无法正常访问。使用fsck修复这个问题分区,虽然修复完成之后文件系统正常,但是发现部分文件丢失,查看后发现缺失的部分文件在lost+found文件夹里,文件名已经发生改变。
|
4天前
|
算法 数据挖掘 Linux
服务器数据恢复—EXT3文件系统下邮件数据恢复案例
服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统+EXT3文件系统。 服务器故障: 由于误删除导致文件系统中的邮件数据丢失。
|
10天前
|
网络安全 Docker 容器
【Bug修复】秒杀服务器异常,轻松恢复网站访问--从防火墙到Docker服务的全面解析
【Bug修复】秒杀服务器异常,轻松恢复网站访问--从防火墙到Docker服务的全面解析
16 0
|
13天前
|
存储 Oracle 关系型数据库
服务器数据恢复—V7000存储NTFS文件系统分区数据恢复案例
服务器存储数据恢复环境: 一台挂载在Windows server服务器上的v7000存储。存储空间划分了一个分区,采用NTFS文件系统,存放oracle数据库。 服务器存储故障: 服务器在运行过程中宕机,于是管理员重启服务器。服务器进入系统自动进行磁盘扫描修复时,管理员强制关机并断开了存储和服务器之间的连接,导致这台存储上的文件系统损坏,报错“文件或目录损坏且无法读取”。
|
5天前
|
弹性计算 网络安全
阿里云国际OpenAPI多接口快速管理ECS服务器教程
阿里云国际OpenAPI多接口快速管理ECS服务器教程

相关产品

  • 云服务器 ECS