服务器数据恢复-RAID5常见故障&raid5数据恢复方案

本文涉及的产品
无影云电脑企业版,4核8GB 120小时 1个月
资源编排,不限时长
无影云电脑个人版,黄金款:40核时/1个月有效
简介: raid5阵列常见故障:1、服务器硬件故障或者RAID阵列卡故障;2、服务器意外断电导致的磁盘阵列故障;3、服务器RAID阵列阵列磁盘出现物理故障,如:电路板坏、磁头损坏、盘面划伤、坏扇区、固件坏等;4、误操作导致磁盘盘序出现错误;5、raid在同步数据或者重建过程中,同组raid阵列中又有其他硬盘掉线导致同步失败。

raid5阵列常见故障:1、服务器硬件故障或者RAID阵列卡故障;
2、服务器意外断电导致的磁盘阵列故障;
3、服务器RAID阵列阵列磁盘出现物理故障,如:电路板坏、磁头损坏、盘面划伤、坏扇区、固件坏等;
4、误操作导致磁盘盘序出现错误;
5、raid在同步数据或者重建过程中,同组raid阵列中又有其他硬盘掉线导致同步失败。

RAID5磁盘阵列出现故障后需要注意的问题:
1、发现RAID5磁盘阵列发生故障或者数据丢失,建议不要盲目进行rebuild操作。
Rebuild:通过阵列的校验功能,根据阵列内其他正常硬盘中的数据,计算&生成损坏硬盘中的数据,然后同步到热备盘中。Rebuild操作适用于raid5阵列中有1块硬盘掉线的情况。针对raid5阵列中有2块磁盘掉线的情况:如果第一块硬盘掉线后服务器有写入操作,第一块掉线的硬盘数据在掉线后就不更新了。rebuild只能对先掉线的磁盘做Rebuild,如果对后掉线的磁盘做Rebuild操作,则部分阵列虽然能正常工作,但会出现数据错乱,某些文件无法打开的情况。
2、RAID5阵列中硬盘掉线,建议不要盲目进行强制上线操作。
从北亚企安数据恢复工程师做过的海量RAID5阵列数据恢复案例中来看,有部分raid5阵列数据丢失的原因是阵列中有一块硬盘离线后没有及时更换硬盘,此后服务器出现故障或者服务器重启,原来离线的硬盘重新上线,而原本在线的硬盘反而故障离线,数据不能正常使用。
用户对后离线的硬盘进行强制上线操作,磁盘阵列自动同步,导致数据新旧混乱,服务器数据丢失。市面上多数品牌和型号的阵列卡在原先离线磁盘自动上线时会检查校验信息,一旦发现校验信息不正确就会重新计算校验信息,无法在缺盘的情况下恢复数据。
3、千万不要进行初始化操作。
初始化类似于低级格式化,一旦对阵列进行初始化操作,这个阵列内所有硬盘的底层数据会被全部清零,导致阵列数据无法恢复。
4、重新配置阵列信息时要保持与原阵列配置信息一致。
一旦重新配置磁盘阵列的信息与原始磁盘阵列的信息不一致,阵列内多数文件将无法打开,导致数据丢失。多数服务器都具有重新配置阵列信息后自动初始化的功能,这将导致数据无法恢复。
5、在进行任何数据恢复操作前,务必将服务器内的所有硬盘以只读方式进行扇区级的镜像备份,避免破坏原始数据。

RAID5数据恢复方案:
1、将故障服务器中所有磁盘编号后取出,由硬件工程师对所有磁盘进行硬件故障检测。针对不存在硬件故障的磁盘,以只读方式做镜像;对于存在硬件故障的磁盘,由硬件工程师处理后使用专门的工具做镜像备份。
2、基于镜像文件分析底层数据,根据分析底层数据获取到的RAID5阵列结构相关信息重组raid5阵列,然后导出数据。
3、验证导出的数据,确认数据无误后重新搭建环境,将恢复出来的数据迁移到准备好的服务器环境中。

相关文章
|
15天前
|
运维 数据挖掘 开发工具
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
服务器磁盘阵列数据恢复环境: 服务器中有两组分别由4块SAS硬盘组建的raid5磁盘阵列,两组raid5阵列划分LUN,组成LVM结构,格式化为EXT3文件系统。 服务器磁盘阵列故障: 服务器中一组raid5阵列中有一块硬盘离线,热备盘自动上线替换离线硬盘。热备盘上线同步数据过程中又有一块硬盘离线,热备盘同步失败,该组raid5阵列崩溃,LVM结构变得不完整,文件系统无法使用。 硬件工程师对两块离线硬盘进行硬件故障检测,发现先离线硬盘无法识别,初步判断该硬盘存在硬件故障,需要进行开盘修复。后离线硬盘可以正常识别。
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
|
5天前
|
存储 数据挖掘 数据库
服务器数据恢复—raid磁盘故障导致数据库数据损坏的数据恢复案例
存储中有一组由3块SAS硬盘组建的raid。上层win server操作系统层面划分了3个分区,数据库存放在D分区,备份存放在E分区。 RAID中一块硬盘的指示灯亮红色,D分区无法识别;E分区可识别,但是拷贝文件报错。管理员重启服务器,导致离线的硬盘上线开始同步数据,同步还没有完成就直接强制关机了,之后就没有动过服务器。
|
23天前
|
SQL 数据挖掘 数据库
服务器数据恢复—意外断电导致XenServer虚拟机不可用的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由4块STAT硬盘通过RAID卡组建的RAID10阵列,上层是XenServer虚拟化平台,虚拟机安装Windows Server操作系统,作为Web服务器使用。 服务器故障: 因机房异常断电导致服务器中一台VPS(Xen Server虚拟机)不可用,虚拟磁盘文件丢失。
服务器数据恢复—意外断电导致XenServer虚拟机不可用的数据恢复案例
|
4天前
|
存储 运维 监控
服务器高效运维管理方案
智能运维作为保障业务连续性和提升系统性能的关键环节,其重要性日益凸显。服务器作为承载各类应用与数据的核心基础设施,其稳定性、安全性和性能直接关系到企业的业务运行效率和用户体验
16 1
|
24天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
21天前
|
存储 数据挖掘 Linux
服务器数据恢复—Linux操作系统网站服务器数据恢复案例
服务器数据恢复环境: 一台linux操作系统服务器上跑了几十个网站,服务器上只有一块SATA硬盘。 服务器故障: 服务器突然宕机,尝试再次启动失败。将硬盘拆下检测,发现存在坏扇区
|
6天前
|
存储 Oracle 关系型数据库
服务器数据恢复—存储硬盘故障导致映射到服务器上的卷挂载不上的数据恢复案例
一台存储上有一组由16块FC硬盘组建了一组raid。存储前面板上的对应10号和13号硬盘的故障灯亮起,存储映射到redhat linux操作系统服务器上的卷挂载不上,业务中断。
|
7天前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN环境下LUN Mapping出错导致文件系统共享冲突的数据恢复案例
服务器数据恢复环境: SAN环境下一台存储设备中有一组由6块硬盘组建的RAID6磁盘阵列,划分若干LUN,MAP到不同业务的SOLARIS操作系统服务器上。 服务器故障: 用户新增了一台服务器,将存储中的某个LUN映射到新增加的这台服务器上。这个映射的LUN其实之前已经MAP到其他SOLARIS操作系统的服务器上了。由于没有及时发现问题,新增加的这台服务器已经对此LUN做了初始化操作,磁盘报错,重启后发现卷无法挂载。
|
23天前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
21天前
|
编解码 前端开发 安全
通过阿里云的活动购买云服务器时如何选择实例、带宽、云盘
在我们选购阿里云服务器的过程中,不管是新用户还是老用户通常都是通过阿里云的活动去买了,一是价格更加实惠,二是活动中的云服务器配置比较丰富,足可以满足大部分用户的需求,但是面对琳琅满目的云服务器实例、带宽和云盘选项,如何选择更适合自己,成为许多用户比较关注的问题。本文将介绍如何在阿里云的活动中选择合适的云服务器实例、带宽和云盘,以供参考和选择。
通过阿里云的活动购买云服务器时如何选择实例、带宽、云盘

相关产品

  • 云服务器 ECS
  • 下一篇
    无影云桌面