【服务器数据恢复】戴尔DELL EMC SC系列存储服务器故障StorageCenter停机错误数据恢复案例

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 客户报告其戴尔DELL SCv/EMC SC E10J (4020) 存储服务器故障,登录后提示Storage Center停机且数据不可访问。此故障可能源于系统问题或硬盘故障。解决方案包括:若为系统问题,可联系戴尔售后重装系统以恢复数据访问;若涉及硬盘损坏,则需物理镜像硬盘或将所有硬盘取出并手动解析虚拟化信息以重组阵列结构。此类故障常见于保修期后的服务器,需定期维护预防。

一:案例描述

客户向我们反馈他们的戴尔DELL SCv/EMC SC E10J机型(4020)存储服务器故障,登录控制器后提示Storage Center停机,所有数据无法访问,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)现象描述

戴尔服务器Storage Center登录成功后无法访问数据,划分的存储空间全部报错,Storage Center停机,连接错误,Data Collector无法与Storage Center通信:

2)原因分析

出现该故障一般有两种可能:

一是戴尔Storage Manager Client系统出现问题。这种故障情况可以理解为一般台式机电脑系统损坏,无法正常启动一样,同理,戴尔SCv/EMC SC系列存储也有着自己的内置系统,该系统崩溃或出现问题后,就可以导致能够登录系统界面,但是无法访问任何的信息;

二是硬盘出现故障,由硬盘故障引起的系统无法访问,需要同一时间损坏3块硬盘,或者是同一时间未知原因同时离线3块硬盘,用户没用及时发现,或没给用户更换硬盘的时间。

2.恢复方案

1)如果是第一种系统损坏的故障情况,可以联系戴尔的售后维修人员,他们会对这个系统进行重装,因为这个系统分外层和内层,如果仅仅是系统损坏的原因造成的故障,硬盘本身没有损坏,直接进行系统重装即可,重装后系统会自动接入内层,这样即可直接访问数据存储层,如图所示:

可以看到重装存储系统后,可以正常的点开下面已经划分的空间,图标带X报错的原因是因为该存储是直接取下来进行重装系统的,这种情况下有两种恢复思路:一是直接按以前的接口把存储重新挂上去连接使用即可,因为内层结构并没有发生改变,直接按以前的接线方式与服务器或交换机进行连接,即可正常使用。二是重新配置Dell Storage Manager Client主机配置,通过HBA和FC将划分的空间挂在到需要使用的系统上进行数据提取或直接使用。

2)如果是硬盘损坏导致的该情况,则需要将损坏硬盘进行物理镜像至新的硬盘内,带校验的需要跳过校验进行扇区对照镜像,即跳过故障盘的校验信息,写入时保留新硬盘的校验信息,进行镜像即可。如果硬盘扇区损坏不是很严重,将按照此方法重新镜像的新硬盘接入存储,进行重启重新配置硬盘,即可通过。如果硬盘扇区损坏严重,又恰好三个坏硬盘上的虚拟化信息没有镜像出来,那么接回原存储也是没办法正常使用的,这种情况下需要将所有硬盘取出,通过专业工具手动解析所有硬盘的虚拟化信息,然后再重组分布式存储的阵列结构,最后再进行数据提取即可。

三:案例总结

戴尔DELL SCv/EMC SC系列Storage Center存储服务器型号多,售后服务及时,性价比高,所以在国内销量一直不错。但是戴尔服务器的标准保修仅有三年时间,三年后才是服务器故障高频率发生的开始。海境超备技术团队通过以往案例经验积累将戴尔服务器的常见故障总结为以下几种:1.服务器不开机、黑屏、蓝屏、卡开机LOGO画面;2.服务器主板损坏进水、雷击、过压、主板老化损坏等;3.服务器阵列信息丢失;4.服务器硬盘丢失或者恢复硬盘上线失败;5.服务器电源损坏;6.Dell服务器操作系统损坏等。

相关文章
|
11天前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
9天前
|
运维 Oracle 关系型数据库
服务器数据恢复—浪潮服务器硬盘出现坏道的数据恢复案例
服务器数据恢复环境: 一台浪潮服务器中有一组由6块SAS硬盘组建的RAID。服务器上划分了1个卷,存放Oracle数据库文件。 服务器故障&检测: 服务器上有两个硬盘指示灯亮黄灯,RAID崩溃,服务器不可用。 将故障服务器中所有磁盘标记后取出。由硬件工程师检测故障服务器上的取出的6块硬盘是否存在硬件故障,经过检测发现变黄的指示灯所对应的2块硬盘存在坏道且SMART的错误冗余级别已经超过阈值。
|
2天前
|
存储 数据挖掘 Linux
服务器数据恢复—ext4文件系统服务器数据恢复案例
服务器数据恢复环境: 某品牌服务器+同品牌存储,Linux centos7+EXT4文件系统。 服务器故障: 意外断电导致服务器操作系统不能正常启动。经过修复后系统可以正常启动,但是挂载的分区无法正常访问。使用fsck修复这个问题分区,虽然修复完成之后文件系统正常,但是发现部分文件丢失,查看后发现缺失的部分文件在lost+found文件夹里,文件名已经发生改变。
|
4天前
|
算法 数据挖掘 Linux
服务器数据恢复—EXT3文件系统下邮件数据恢复案例
服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统+EXT3文件系统。 服务器故障: 由于误删除导致文件系统中的邮件数据丢失。
|
6天前
|
存储 弹性计算 安全
阿里云第七代云服务器ECS性能、适用场景与价格参考
阿里云第七代云服务器ECS(Elastic Compute Service)作为阿里云最新一代的高性能计算产品,凭借其基于最新硬件架构和虚拟化技术的全面升级,在计算能力、存储性能、网络传输速度以及灵活性等多个方面实现了显著提升。这一代云服务器旨在为用户提供更为强大、稳定且可定制的云端基础设施服务,广泛适用于从基础的Web托管到复杂的高性能计算等多种应用场景。
|
5天前
|
弹性计算 网络安全
阿里云国际OpenAPI多接口快速管理ECS服务器教程
阿里云国际OpenAPI多接口快速管理ECS服务器教程
|
3天前
|
弹性计算 开发框架 .NET
阿里云服务器购买教程及云服务器地域、实例、操作系统、带宽等参数选择指南
对于初次购买阿里云服务器的用户来说,想使用阿里云服务器搭建网站或者运行APP、小程序等项目,第一步就是要先购买阿里云服务器,下面小编以图文形式给大家介绍一下阿里云服务器的购买流程,以及购买过程中如何云服务器地域、实例、带宽等关键配置和选择这些参数的一些注意事项,以供参考。
|
6天前
|
域名解析 网络协议 数据安全/隐私保护
阿里云轻量应用服务器搭建WordPress个人博客教程
阿里云轻量应用服务器搭建WordPress个人博客教程
|
10天前
|
存储 机器学习/深度学习 应用服务中间件
阿里云倚天云服务器实例:计算型c8y、通用型g8y、内存型r8y实例介绍
阿里云倚天云服务器是基于阿里云自研的倚天710 ARM架构CPU打造的高性能计算产品系列,它依托先进的第四代神龙架构,旨在为用户提供稳定可预期的超高效能体验。倚天云服务器在存储、网络性能及计算稳定性方面实现了显著提升,主要得益于其芯片级的快速路径加速技术。本文将深度解析阿里云倚天云服务器的计算型c8y、通用型g8y、内存型r8y实例,探讨其优势及适用场景,以供选择参考。
|
11天前
|
网络协议 应用服务中间件 网络安全
阿里云轻量应用服务器的使用限制
阿里云轻量应用服务器的使用限制