虚拟化数据恢复—VMFS简介&误删除虚拟机的数据恢复案例

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
简介: 物理区:物理上连续的磁盘空间,即通常意义上的分区。本地区:VMFS管理的物理区分为保留区和本地区,前面一部分是保留区,后面部分是本地区。本地区又分为元文件区和数据区。元文件:与NTFS的元文件类似,属于FS的管理用数据。VMFS有6个元文件:.VH.SF/.FBB.SF/.FDC.SF/.SBC.SF/.PBC.SF/.PB2.SF。元文件区:6个元文件占用的所有空间,在本地区的前面部分。数据区:用于存放文件数据。datastore:在ESX服务器上看到的VMFS存储空间。LV:logical volume,所指的范围其实和本地区一样,即虚拟化卷。LVM逻辑卷组:用来管理跨dis

VMFS简介:
物理区:物理上连续的磁盘空间,即通常意义上的分区。
本地区:VMFS管理的物理区分为保留区和本地区,前面一部分是保留区,后面部分是本地区。本地区又分为元文件区和数据区。
元文件:与NTFS的元文件类似,属于FS的管理用数据。VMFS有6个元文件:.VH.SF/.FBB.SF/.FDC.SF/.SBC.SF/.PBC.SF/.PB2.SF。
元文件区:6个元文件占用的所有空间,在本地区的前面部分。
数据区:用于存放文件数据。
datastore:在ESX服务器上看到的VMFS存储空间。
LV:logical volume,所指的范围其实和本地区一样,即虚拟化卷。
LVM逻辑卷组:用来管理跨disk的LV,相当于VMFS的存储空间datastore。

VMFS元文件:
.VH.SF: volume header文件,承载了‘本地区(或者LV)’的大小、时间、块大小、块数等信息。
.FBB.SF:file-bitmap文件,承载了‘datastore’里的块使用情况的位图信息。
.FDC.SF:file-discriptor文件,承载了‘datastore’里所有文件、目录的结点信息。
.SBC.SF: subblock分配文件,承载了‘datastore’里所有小文件、目录的数据区。
.PBC.SF: point-block文件,指针文件,承载了大文件的额外指针(超出结点记录范围的地址)。
.PB2.SF: .PBC.SF的再扩展。

虚拟机删除的数据恢复流程:
虚拟机删除后空间被回收,数据会暂存于自由空间中。根据entry中的位图将所有空闲子块全部提取出来,在自由空间中进行查找恢复,防止现有数据的干扰。虚拟机删除后是否可以恢复,关键在于磁盘头部是否还存在,若磁盘头部还存在就可以尝试拼接虚拟磁盘。
1、将所有磁盘做好标记后取出,硬件工程师对所有硬盘进行检测看是否有硬盘存在硬件故障。如果有硬盘存在硬件故障,尝试修复故障硬盘。
2、将所有磁盘在只读模式下进行扇区级全盘镜像,镜像完成后将所有磁盘按照原样还原到原服务器/存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像分析所有磁盘底层数据。需要分析的内容包括:每个块组中子块的数量,每个area中entry的数量,元文件头部的大小,子块大小,area的数量。根据entry特征值分析entry的大小。根据entry中的位图信息,使用北亚企安自主开发的虚拟化数据恢复工具提取VMFS卷的自由子块。
4、通过解析每个块第一条指针至数据区来判断丢失虚拟磁盘头部是否存在。如果存在则尝试进行虚拟机的拼接工作。
5、遍历所有类型的子块,判断第一条指针是否为磁盘头部。使用北亚企安自主开发的虚拟化分析工具判断每个类型子块第一条指针是否为磁盘头部及头部类型(MBR、EXT4、LVM、Sparse、SeSparse等),并将判断结果保存至数据库中。数据库只记录磁盘类型和磁盘头部所在位置,需根据丢失虚拟机大小、文件系统等判断是否有符合丢失磁盘特征的头部。
6、分析符合特征的磁盘头部。按照文件系统存储结构进行寻址拼接。计算出需要匹配数据块的特征值和该数据块在磁盘中的位置,以及特征值在数据库内的偏移位置。
7、根据需要修复的文件系统特征值和位置,使用北亚企安自研的工具匹配符合结构的数据块。
8、根据匹配结果及该数据块在子块中的连续性,使用北亚企安自研的工具拼接正确的数据块。直至恢复出所有数据。

相关文章
|
8天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
179589 21
|
15天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
17天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
9438 24
|
21天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
5105 15
资料合集|Flink Forward Asia 2024 上海站
|
21天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
5天前
|
JSON 分布式计算 数据处理
加速数据处理与AI开发的利器:阿里云MaxFrame实验评测
随着数据量的爆炸式增长,传统数据分析方法逐渐显现出局限性。Python作为数据科学领域的主流语言,因其简洁易用和丰富的库支持备受青睐。阿里云推出的MaxFrame是一个专为Python开发者设计的分布式计算框架,旨在充分利用MaxCompute的强大能力,提供高效、灵活且易于使用的工具,应对大规模数据处理需求。MaxFrame不仅继承了Pandas等流行数据处理库的友好接口,还通过集成先进的分布式计算技术,显著提升了数据处理的速度和效率。
|
29天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
16天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
1247 74