分布式存储数据恢复—hbase和hive数据库数据恢复案例-阿里云开发者社区

分布式存储数据恢复—hbase和hive数据库数据恢复案例

2025-04-17 583

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 分布式存储数据恢复环境：16台某品牌R730xd服务器节点，每台服务器节点上有数台虚拟机。虚拟机上部署Hbase和Hive数据库。分布式存储故障：数据库底层文件被误删除，数据库不能使用。要求恢复hbase和hive数据库。

分布式存储数据恢复环境：
16台某品牌R730xd服务器节点，每台服务器节点上有数台虚拟机。
虚拟机上部署Hbase和Hive数据库。

分布式存储故障：
数据库底层文件被误删除，数据库不能使用。要求恢复hbase和hive数据库。
北亚企安数据恢复工程师到现场进行检测，发现虚拟机可以正常启动，虚拟机上的数据库块文件丢失。所幸的是块文件被删除之后，整个集群环境没有再进行数据的写入。

分布式存储数据恢复过程：
1、将故障服务器上所有硬盘编号后取出，经过硬件工程师检测后没有发现存在硬件故障和坏道。准备一台用来恢复数据的服务器，以只读方式挂载故障服务器上的硬盘，进行扇区级别的完整备份。
备份完成后将所有硬盘根据编号按照原样还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行，避免对原始磁盘数据造成二次破坏。
2、分析每个虚拟机磁盘的块文件、文件底层的聚合方式、每个磁盘中数据的分布情况、Block文件key。
3、定位、提取、解析并整合数据库文件中key信息。
4、根据Block文件的key信息提取文件片段。拼接Block文件的片段并校验拼接后的Block文件的正确性。
5、校验提取出的Block文件的完整性及正确性，然后将提取出来的Block文件导入到hbase和hive数据库中。
6、由用户方详细验证数据。如果发现问题，重新检验上述所有恢复过程。直到没有任何问题。

分布式存储数据恢复—hbase和hive数据库数据恢复案例

弹性计算

热门文章

最新文章

相关课程

相关电子书