开发者社区> boxti> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

硬盘驱动器故障暴露出备份脆弱性

简介:
+关注继续查看

硬盘驱动器更换看起来简单,其实正好相反,IT部门必须深入到服务器的核心才能真正提供解决方案。

数据中心有一台服务器闪烁着琥珀色的灯光,这个警告意味着硬盘驱动器有潜在的问题。通常,当一个灯在这里和那里开始闪烁时,人们呼吁更换驱动器,希望热插拔驱动器,并采取一种快乐的方式。但一次经历却大不相同。

在那一天,有两个驱动器在忙碌的时候开始闪烁。并已列入工作人员的待办事项列表好几天了,当另一个IT员工Bob询问是否需要注意这种状况,所以将这个任务交给Bob处理,他要求在第二天交付新硬盘。

几天后,Bob表示硬盘驱动器已经更换,一个已经重建,另一个要花费一段时间恢复。

不祥的预兆

然而不久,一名员工报告说无法访问公司的共享驱动器。技术人员开始研究它,当技术人员与另一个用户接触时,表示也遇到了同样的问题。工作人员开始意识到,所有的迹象都表明这些明显的新问题与最近更换的硬盘驱动器有关。

工作人员远程访问发生问题的服务器,这台服务器托管了五个虚拟服务器。在这一点是公司的心脏和灵魂,也就是企业的主要数据库,被托管在不同的物理服务器上。

当工作人员在远程登录时,看到一个警告,虚拟磁盘不再存在,意识到Bob已交换的两个硬盘驱动器被同时从同一个阵列拔出。服务器在RAID5+0中的原始设置比较早,并没有得到破坏。

更深层次的问题

在初始的拒绝和希望服务器可以正确启动后,工作人员转向备份,据说是设置为通过iSCSI提供NAS。工作人员已经检查了随着时间推移的日志,直到工作成功完成。但是无法验证这一点,因为一些虚拟服务器还包括这家公司的备份软件。

最终,工作人员意识到备份已经消失了。似乎服务器已经复制并存储在与原始虚拟服务器相同的主机上,在这种情况下显然没有什么好处。

工作人员对此感到恐慌,他们希望可以做些什么,以便恢复和运行,至少让用户可以登录(因为域控制器被擦除),并能够访问几个月前迁移到NAS的公司数据。

Bob在报告问题后很快与同事从头开始重建域控制器,Office365控件,打印服务器和许多其他功能。终于能够及时地解决了问题。在接下来的几个星期,工作人员开始恢复在服务器丢失缺少的信息,并最终从虚拟磁盘损坏时创建的大量数据中挖掘出来。

现在是人们重新审视核心IT流程和提醒关键要点的好时机:

·始终检查备份的物理位置,以验证其是否存在,而不是单独的备份日志。

·了解企业的RAID阵列以及公司或客户的具体情况,并在进行更改时小心谨慎。

·执行任务,如在数据灾难发生后,硬盘驱动器交换等。

·再次检查备份。

·IT工作更加仔细小心,以防万一。

·不要将所有鸡蛋(或虚拟服务器)放在一个篮子中。

·为了更好的实施,请再次检查这些备份。

本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
基于Tablestore的一站式物联网存储解决方案-数据操作篇
## 前言 上一章节介绍了共享充电宝场景的表结构设计。本章节主要为大家介绍如何使用表格存储Tabelstore数据表实现基本数据读写、批量更新,以及利用多元索引特性实现多维度查询功能。 ## 准备工作 - 测试数据说明 | 数据表 | 数据表名 | 数据行数 | 说明 | | --- | --- | --- | --- | | 元数据表 | cabinet | 一千万行 | 模拟一千万台机柜 |
223 0
消防隐患同比下降约60%,基于物联网大数据的智慧消防水系统远程监测方案
基于物联网大数据的智慧消防水系统远程监测平台,以物联网技术为核心,利用各种智能传感器实时采集监测压力等数据,实时监测压力过低或过高自动报警,可及时发现管道堵塞、阀门关闭、管道破裂等异常情况,并通过无线通讯网络实时传输到云端服务器监测中心,由云端的软件系统对数据进行存储、分析、查询、报警处理等功能,帮助用户对消火栓设备进行有效的管理。
2493 0
硬盘健康状态监测
硬盘健康状态监测脚本
1260 0
最有用的找回硬盘分区表软件-TestDisk
当你的硬盘分区不小心被覆盖了,你首先想到的是什么软件? 国产软件DiskGen?在你毁掉分区表之前,你又备份分区表就有用,可惜大多数人都没有这个习惯。如果靠它扫描找回分区表,基本没戏。 俄罗斯的R-Studio,这是很好的扫描并记录每个扇区的软件,可以立即把硬盘信息想、记录下来,防止后面的不当操作导致最终无法恢复。
956 0
Gmail电子邮件曝全球性故障 谷歌向用户道歉
2月25日消息,据国外媒体报道,针对周二发生的“Gmail全球登录故障”,谷歌向用户做出了道歉,并表示Gmail服务已于太平洋时间24日上午6时44分恢复正常。   谷歌服务可靠性经理阿卡西奥·克鲁兹(Acacio Cruz)周二曾表示:“如果你今天登陆Gmail账户,你会发现出现了一些故障。
871 0
+关注
boxti
12535
10005
文章
1326
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载