【服务器数据恢复】戴尔DELL EMC SC系列存储服务器故障StorageCenter停机错误数据恢复案例

本文涉及的产品
对象存储 OSS,20GB 3个月
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
文件存储 NAS,50GB 3个月
简介: 客户报告其戴尔DELL SCv/EMC SC E10J (4020) 存储服务器故障,登录后提示Storage Center停机且数据不可访问。此故障可能源于系统问题或硬盘故障。解决方案包括:若为系统问题,可联系戴尔售后重装系统以恢复数据访问;若涉及硬盘损坏,则需物理镜像硬盘或将所有硬盘取出并手动解析虚拟化信息以重组阵列结构。此类故障常见于保修期后的服务器,需定期维护预防。

一:案例描述

客户向我们反馈他们的戴尔DELL SCv/EMC SC E10J机型(4020)存储服务器故障,登录控制器后提示Storage Center停机,所有数据无法访问,希望能够帮助他们进行数据恢复。

二:解决方案

1.案例评估

1)现象描述

戴尔服务器Storage Center登录成功后无法访问数据,划分的存储空间全部报错,Storage Center停机,连接错误,Data Collector无法与Storage Center通信:

2)原因分析

出现该故障一般有两种可能:

一是戴尔Storage Manager Client系统出现问题。这种故障情况可以理解为一般台式机电脑系统损坏,无法正常启动一样,同理,戴尔SCv/EMC SC系列存储也有着自己的内置系统,该系统崩溃或出现问题后,就可以导致能够登录系统界面,但是无法访问任何的信息;

二是硬盘出现故障,由硬盘故障引起的系统无法访问,需要同一时间损坏3块硬盘,或者是同一时间未知原因同时离线3块硬盘,用户没用及时发现,或没给用户更换硬盘的时间。

2.恢复方案

1)如果是第一种系统损坏的故障情况,可以联系戴尔的售后维修人员,他们会对这个系统进行重装,因为这个系统分外层和内层,如果仅仅是系统损坏的原因造成的故障,硬盘本身没有损坏,直接进行系统重装即可,重装后系统会自动接入内层,这样即可直接访问数据存储层,如图所示:

可以看到重装存储系统后,可以正常的点开下面已经划分的空间,图标带X报错的原因是因为该存储是直接取下来进行重装系统的,这种情况下有两种恢复思路:一是直接按以前的接口把存储重新挂上去连接使用即可,因为内层结构并没有发生改变,直接按以前的接线方式与服务器或交换机进行连接,即可正常使用。二是重新配置Dell Storage Manager Client主机配置,通过HBA和FC将划分的空间挂在到需要使用的系统上进行数据提取或直接使用。

2)如果是硬盘损坏导致的该情况,则需要将损坏硬盘进行物理镜像至新的硬盘内,带校验的需要跳过校验进行扇区对照镜像,即跳过故障盘的校验信息,写入时保留新硬盘的校验信息,进行镜像即可。如果硬盘扇区损坏不是很严重,将按照此方法重新镜像的新硬盘接入存储,进行重启重新配置硬盘,即可通过。如果硬盘扇区损坏严重,又恰好三个坏硬盘上的虚拟化信息没有镜像出来,那么接回原存储也是没办法正常使用的,这种情况下需要将所有硬盘取出,通过专业工具手动解析所有硬盘的虚拟化信息,然后再重组分布式存储的阵列结构,最后再进行数据提取即可。

三:案例总结

戴尔DELL SCv/EMC SC系列Storage Center存储服务器型号多,售后服务及时,性价比高,所以在国内销量一直不错。但是戴尔服务器的标准保修仅有三年时间,三年后才是服务器故障高频率发生的开始。海境超备技术团队通过以往案例经验积累将戴尔服务器的常见故障总结为以下几种:1.服务器不开机、黑屏、蓝屏、卡开机LOGO画面;2.服务器主板损坏进水、雷击、过压、主板老化损坏等;3.服务器阵列信息丢失;4.服务器硬盘丢失或者恢复硬盘上线失败;5.服务器电源损坏;6.Dell服务器操作系统损坏等。

相关文章
|
3天前
|
存储 运维
服务器数据恢复—服务器raid5阵列中硬盘离线的数据恢复案例
某公司一台服务器中有一组多块硬盘组成的磁盘阵列。磁盘阵列中有2块硬盘出现故障离线,服务器崩溃,上层数据丢失。
|
5天前
|
数据挖掘
服务器数据恢复—服务器raid5阵列中2块硬盘掉线的数据恢复案例
某公司一台服务器,服务器上有一组由8块硬盘组建的raid5磁盘阵列。 磁盘阵列中2块硬盘的指示灯显示异常,其他硬盘指示灯显示正常。上层应用不可用。
|
10天前
|
存储 运维 数据挖掘
服务器数据恢复—服务器raid5阵列硬盘出现坏道掉线的数据恢复案例
一台服务器中有一组由16块SAS接口的硬盘组建的raid5阵列。 服务器磁盘阵列中有2块硬盘离线,服务器上跑的应用崩溃。 经过后续的分析发现丢失的数据为虚拟机文件,包含4个卷的数据。
|
1天前
|
存储 人工智能 运维
阿里云操作系统控制台——解决服务器磁盘I/O故障
阿里云操作系统控制台——解决服务器磁盘I/O故障
28 12
|
1天前
|
弹性计算 运维 监控
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
48 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
|
2天前
|
弹性计算 Linux 数据安全/隐私保护
阿里云幻兽帕鲁联机服务器搭建全攻略,速来抄作业!2025新版教程
阿里云提供2025年最新幻兽帕鲁服务器申请购买及一键开服教程。4核16G配置支持8人,70元/月;8核32G配置支持20人,160元/月。选择配置、地域、操作系统后,点击【一键购买及部署】,约3分钟完成创建。本地安装STEAM客户端并登录,进入游戏选择多人模式,输入服务器IP和端口(8211),即可开始游戏。详细教程及更多问题解答请参考阿里云幻兽帕鲁游戏专区。
43 20
|
4天前
|
弹性计算 数据可视化 Linux
阿里云操作系统控制台——ECS操作与性能优化
本文详细介绍如何操作阿里云服务器ECS,从开通到组件安装及内存诊断。首先,通过选择操作系统(如Alibaba Cloud Linux 3)并开通服务,创建RAM用户并授予权限。接着,安装所需组件,支持节点或集群安装。最后,利用内存全景诊断功能,输入实例ID或Pod名称发起诊断并解析结果。这一流程帮助用户高效搭建计算环境,提升技术能力,确保业务稳定运行,并提出优化建议以改善用户体验。
57 8
|
4天前
|
弹性计算 运维 Cloud Native
阿里云虚拟主机、轻量应用服务器、云服务器、云·速成美站、云·原生建站区别及选择参考
在选择阿里云产品完整自己网站搭建的时候,面对云虚拟主机、轻量应用服务器、云服务器ECS、云·速成美站和云·原生建站等多种选择,很多用户不是很清楚他们之间的区别。每种产品都有其独特的优势和适用场景,如何根据自己的需求和技术背景选择最适合的建站产品,成为了用户关注的焦点。本文将详细比较阿里云这五种建站产品的优势和劣势,以及它们的适用人群,以供选择参考。
|
6天前
|
存储 弹性计算 运维
课时1:阿里云云服务器ECS介绍
阿里云ECS服务器解决了传统服务器采购周期长、资源闲置和维护成本高等问题。企业无需预先采购昂贵硬件,按需购买云服务,具备完善的架构、广泛场景覆盖及卓越性能,支持50多款操作系统,针对21个业务场景优化,提供上百种规格选择。ECS确保数据安全与业务连续性,历史可用性高达99.9999%,助力企业高效转型。
|
12天前
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。