【服务器数据恢复】EVA存储硬盘离线,LUN丢失的数据恢复案例

简介: 一台EVA存储设备中有两块硬盘掉线,lun丢失。将故障EVA存储设备上的所有硬盘编号后取出。硬件工程师对所有硬盘进行硬件故障检测。检测后发现掉线硬盘不存在物理故障和坏道。将所有硬盘以只读方式做全盘镜像备份,镜像完成后将所有磁盘按照编号还原到原EVA存储设备中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

服务器存储数据恢复环境&故障:
一台EVA存储设备中有两块硬盘掉线,lun丢失。
将故障EVA存储设备上的所有硬盘编号后取出。硬件工程师对所有硬盘进行硬件故障检测。检测后发现掉线硬盘不存在物理故障和坏道。将所有硬盘以只读方式做全盘镜像备份,镜像完成后将所有磁盘按照编号还原到原EVA存储设备中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
硬盘掉线,但是硬盘不存在物理故障,初步判断硬盘掉线的原因是硬盘读写不稳定。读写不稳定的硬盘会被控制器识别为坏盘并踢出。
通过分析EVA存储设备内的raid条目存储形式,每个硬盘的不同块组成一个raid条目,每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存放在不同的磁盘中,使用一个索引来指定其位置。因此去每个磁盘中找这个指向LUN_MAP的索引就可以找到现存LUN的信息了。
该案例中的LUN中的磁盘阵列都是RAID5阵列,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值作比较就可以判断这个条目中是否有掉线盘。将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中哪些RAID条目中有掉线盘。这些RAID条目中都存在的那个盘就一定是掉线盘。排除掉线盘,然后根据LUN_MAP恢复所有LUN的数据即可。

服务器存储数据恢复过程:
1、北亚企安数据恢复工程师编写程序扫描全部LUN_MAP,结合人工分析获取到准确的LUN_MAP。数据恢复工程师编写程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。数据恢复工程师编写程序,结合LUN_MAP恢复所有LUN数据。人工核对每个LUN,确认是否和用户方工程师描述的一致。
2、根据用户方工程师描述,所有LUN的数据分成两大部分:Vmware的虚拟机和HP-UX上的裸设备。裸设备存放的是Oracle的dbf数据库。由于恢复的是LUN,无法看到里面的文件,因此需要人工的核对哪些LUN是存放Vmware的数据,哪些LUN是存放HP-UX的裸设备。然后将LUN挂载到不同的验证环境中验证恢复的数据是否完整。
3、在一台服务器上安装了ESXI虚拟主机环境,然后通过iSCSI的方式将恢复出来的LUN挂载到虚拟主机上。
但是在VMware vSphere Client上扫描,却没有发现扫描到vmfs卷。发现因为EXSI版本不同。
数据恢复工程师于是换一种验证方式:将所有符合vmware虚拟机的LUN里面的虚拟机文件都生成出来,然后通过NFS共享的方式挂载到虚拟主机上,然后将虚拟机一个一个的添加到清单。
4、通过NFS将所有虚拟机都添加到虚拟主机以后,将所有虚拟机都加电开机,都能启动系统。交由用户方工程师远程验证虚拟机里面的数据,确认没有问题。本次数据恢复工作完成。

相关文章
|
2月前
|
监控 安全 Unix
iOS 崩溃排查不再靠猜!这份分层捕获指南请收好
从 Mach 内核异常到 NSException,从堆栈遍历到僵尸对象检测,阿里云 RUM iOS SDK 基于 KSCrash 构建了一套完整、异步安全、生产可用的崩溃捕获体系,让每一个线上崩溃都能被精准定位。
605 70
|
2月前
|
存储 数据挖掘
服务器数据恢复—RAIDZ多块硬盘离线导致ZPOOL下线的数据恢复案例
某存储设备中一共有40块磁盘组建存储池,其中4块磁盘作为全局热备盘使用。存储池内划分出若干空间映射到服务器使用。 服务器存储设备在没有断电、进水、异常操作、供电不稳定等外部因素的情况下突然崩溃。管理员重启服务器后无法进入操作系统,数据丢失。
|
4月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
5480 80
|
27天前
|
运维
服务器数据恢复—服务器常见故障&服务器数据恢复常规流程揭秘
服务器数据恢复到底是一个什么样的流程? 服务器数据丢失后,进行数据恢复前应该做哪些准备? 服务器出现故障后应该如何操作才能避免数据被二次破坏?
|
7月前
|
NoSQL MongoDB 数据库
数据库数据恢复—MongoDB数据库数据恢复案例
MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员在MongoDB服务仍然开启的情况下将MongoDB数据库文件拷贝到其他分区,数据复制完成后将MongoDB数据库原先所在的分区进行了格式化操作。 结果发现拷贝过去的数据无法使用。管理员又将数据拷贝回原始分区,MongoDB服务仍然无法使用,报错“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
|
9月前
|
数据挖掘 Linux
服务器数据恢复—服务器重装系统导致分区改变的数据恢复案例
服务器上有一组由raid卡组建的raid5磁盘阵列。上层安装linux才做系统,采用XFS文件系统,划分了3个分区。 管理员将服务器的操作系统重装后,发现服务器上的分区发生了改变:一个分区消失,其他分区不可访问。
|
10月前
|
SQL 数据库 数据安全/隐私保护
数据库数据恢复——sql server数据库被加密的数据恢复案例
SQL server数据库数据故障: SQL server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。 数据库备份被加密,文件名字被篡改。
|
6月前
|
缓存 前端开发 IDE
硬盘数据恢复—硬盘物理故障判定妙招
硬盘的物理结构可以分为外部结构和内部结构。外部结构主要包括硬盘的外壳和电路板,硬盘的外部物理故障通常是电路板故障。 硬盘的电路板上分布着主控芯片、缓存、电机驱动芯片、BIOS及其他电子元器件。在电路板前端还有硬盘的电源接口和数据线接口。这些电路板上的元器件都有出现故障的可能。
|
5月前
|
存储 数据挖掘 Windows
服务器数据恢复—RAIDZ上层ZFS文件系统数据恢复案例
一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管理员重启服务器,但是服务器无法进入系统。管理员联系北亚企安数据恢复工程师要求恢复服务器数据。
|
5月前
|
存储
服务器数据恢复—服务器断电导致数据丢失的数据恢复案例
某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现服务器无法正常工作。 根据描述的故障发生过程,北亚企安数据恢复工程师推断故障是意外断电导致raid模块损坏。

热门文章

最新文章