分布式存储数据恢复—hbase和hive数据库数据恢复案例

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
简介: 分布式存储数据恢复环境:16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。虚拟机上部署Hbase和Hive数据库。分布式存储故障:数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。

分布式存储数据恢复环境:
16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。
虚拟机上部署Hbase和Hive数据库。

分布式存储故障:
数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。
北亚企安数据恢复工程师到现场进行检测,发现虚拟机可以正常启动,虚拟机上的数据库块文件丢失。所幸的是块文件被删除之后,整个集群环境没有再进行数据的写入。

分布式存储数据恢复过程:
1、将故障服务器上所有硬盘编号后取出,经过硬件工程师检测后没有发现存在硬件故障和坏道。准备一台用来恢复数据的服务器,以只读方式挂载故障服务器上的硬盘,进行扇区级别的完整备份。
备份完成后将所有硬盘根据编号按照原样还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、分析每个虚拟机磁盘的块文件、文件底层的聚合方式、每个磁盘中数据的分布情况、Block文件key。
3、定位、提取、解析并整合数据库文件中key信息。
4、根据Block文件的key信息提取文件片段。拼接Block文件的片段并校验拼接后的Block文件的正确性。
5、校验提取出的Block文件的完整性及正确性,然后将提取出来的Block文件导入到hbase和hive数据库中。
6、由用户方详细验证数据。如果发现问题,重新检验上述所有恢复过程。直到没有任何问题。

目录
打赏
0
11
12
1
223
分享
相关文章
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,展现卓越性能与性价比。其轻量版满足国产化需求,兼具高性能与低成本,适用于多种场景,推动数据库技术革新与发展。
ClickHouse分布式数据库动态伸缩(弹性扩缩容)的实现
实现ClickHouse数据库的动态伸缩需要持续的维护和精细的操作。从集群配置到数据迁移,再到监控和自动化,每一步都要仔细管理以确保服务的可靠性和性能。这些活动可以显著提高应用的响应性和成本效率,帮助业务根据实际需求灵活调整资源分配。
137 10
【赵渝强老师】基于PostgreSQL的分布式数据库:Citus
Citus 是基于 PostgreSQL 的开源分布式数据库,采用 shared nothing 架构,具备良好的扩展性。它以插件形式集成,部署简单,适用于处理大规模数据和高并发场景。本文介绍了 Citus 的基础概念、安装配置步骤及其在单机环境下的集群搭建方法。
179 2
【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错
【YashanDB 知识库】Hive 命令工具 insert 崖山数据库报错
【YashanDB知识库】Hive 命令工具insert崖山数据库报错
【YashanDB知识库】Hive 命令工具insert崖山数据库报错
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
330 1
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问