【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN ESXi超融合HCI分布式存储数据恢复案例

本文涉及的产品
对象存储 OSS,标准 - 本地冗余存储 20GB 3个月
对象存储 OSS,标准 - 同城冗余存储 20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
简介: 近期,我司处理了一个由10台华为OceanStor存储组成的vSAN超融合架构,其中一台存储闪存盘出现故障,用户取下后用新的闪存盘代替,然后对该闪存盘所在的磁盘组进行重建,导致集群中一台使用0置备策略的虚拟机数据丢失。

一:案例描述

近期,我司处理了一个由10台华为OceanStor存储组成的vSAN超融合架构,其中一台存储闪存盘出现故障,用户取下后用新的闪存盘代替,然后对该闪存盘所在的磁盘组进行重建,导致集群中一台使用0置备策略的虚拟机数据丢失。

vSAN.png

二:解决方案

1.案例评估

经过现场勘验,得知10台存储都采用相同的配置,2块300GB的ESXi系统盘(RAID1),8块2TB的HDD物理硬盘,4块480GB的SSD闪存盘,重建磁盘组后丢失一个ID为***的虚拟磁盘文件,该虚拟磁盘大小为20TB。ESXi系统盘是独立的,与HDD物理盘和SSD闪存盘是隔绝的,不参与数据存储工作,采用的是常见的VMFS分区结构;其中2块HHD加上1块SSD组成一个磁盘组,本次案例用户在创建集群的时候,选择的是单点式存储,启用了vSAN,三块硬盘都采用了vSAN分区结构;故:同一磁盘组下的2块HDD隶属磁盘组内的SSD,但并没有直接数据关系。

整个VMware vSphere共控制多个集群,其中出现故障的集群使用的vSAN分布式结构存储,该vSAN由10台华为2288H V5 存储构成,每一台存储由2块HDD(物理盘)和一块SSD(闪存盘)构成1个磁盘组,每台存储都有4个磁盘组。

vSAN1.png

2.恢复方案

为确保数据的安全性,需要将10台存储的所有硬盘单独取出,并逐一进行完整的扇区镜像,再对镜像盘进行恢复操作;逐一镜像完成后,使用我司自主研发的VMware vSAN数据恢复系统对镜像文件进行扫描,提取每一块硬盘上面分布式存放的数据单元;使用前依据虚拟对象ID,查找该ID的数据分布情况,查找隶属于该ID的故障域和子故障域将获取的信息写入程序根目录的data.ini配置文件中(如果有数据则清空再写入)。设置组件保存路径,然后分次逐一选择已镜像的磁盘文件,也可以直接选择所有镜像文件所在的目录,VMware vSAN数据恢复系统会自动扫描分散的数据单元,并重构虚拟磁盘文件。数据提取完成后,最终使用任意软件对重构后的文件进行展开,加载后即可访问虚拟磁盘内的文件数据。

vsan3.jpg vsan4.jpg

三:案例总结

随着数据存储量越来越大,一般的存储难以满足很多大公司的使用需求,故数据中心服务器出现了各种虚拟化平台,这些平台为了更好的幸好和方便管理,都自研了一些独有的存储方式,其中最常见的就是分布式存储是基于VMware vSphere ESXi虚拟机所创建的vSAN分布式存储架构。vSAN对象可以看成一个卷,也可以理解成是一个逻辑卷,每个存在于数据存储上的vSAN对象都是由多个组件构成,这些组件分布于集群主机上的磁盘组中。在恢复vSAN数据的过程中,获取组件信息是最关键的,因为组件是每个对象的重要组成部分。

相关文章
|
3月前
|
存储 固态存储 Linux
从 0 学服务器虚拟化:VMware 搭建 3 个虚拟主机,个人 / 小企业够用的方案
服务器虚拟化技术通过在单台物理机上运行多个虚拟机,显著提升资源利用率和管理灵活性。本文以 VMware ESXi 8.0 Update 3e 为例,详解如何搭建经济实用的虚拟化环境,支持 3 个虚拟主机稳定运行,适合个人开发者和小企业降低硬件投入、实现数据本地化与安全存储。
633 0
|
12月前
|
存储 人工智能 运维
龙蜥副理事长张东:加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统
操作系统如何满足 AI 应用场景需求?未来发展趋势如何?
|
8月前
|
存储 虚拟化 数据中心
VMware ESXi 8.0U3d macOS Unlocker & OEM BIOS 标准版和厂商定制版,已适配主流品牌服务器
VMware ESXi 8.0U3d macOS Unlocker & OEM BIOS 标准版和厂商定制版,已适配主流品牌服务器
188 5
VMware ESXi 8.0U3d macOS Unlocker & OEM BIOS 标准版和厂商定制版,已适配主流品牌服务器
|
8月前
|
数据挖掘 虚拟化
虚拟化数据恢复—VMware虚拟化环境下重装系统导致服务器崩溃的数据恢复
VMware虚拟化平台 vmfs文件系统 工作人员误操作重装操作系统,服务器崩溃。 重装系统会导致文件系统元文件被覆盖。要恢复数据,必须找到&提取重装系统前的文件系统残留信息,通过提取出来的元文件信息恢复虚拟磁盘。通过拼接虚拟磁盘来恢复服务器数据。
174 13
|
12月前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
300 50
|
10月前
|
存储 人工智能 算法
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
本次方案的主题是加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统,从产业洞察、创新实践、发展建议三个方面,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。 1. 产业洞察 2. 创新实践 3. 发展建议
317 6
|
11月前
|
运维 数据挖掘 索引
服务器数据恢复—Lustre分布式文件系统服务器数据恢复案例
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。 机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。
|
12月前
|
存储 网络安全 虚拟化
虚拟化数据恢复—VMware ESX SERVER数据恢复案例
虚拟化数据恢复环境&故障: 某单位信息管理平台,数台VMware ESX SERVER共享一台某品牌DS4100存储。 vc报告虚拟磁盘丢失,管理员ssh到ESX中执行fdisk -l查看磁盘,发现STORAGE中的分区表不见了。重启所有设备后,ESX SERVER均无法连接到DS4100存储中的STORAGE。
|
缓存 NoSQL Ubuntu
大数据-39 Redis 高并发分布式缓存 Ubuntu源码编译安装 云服务器 启动并测试 redis-server redis-cli
大数据-39 Redis 高并发分布式缓存 Ubuntu源码编译安装 云服务器 启动并测试 redis-server redis-cli
183 3
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
227 1

热门文章

最新文章