《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(2)

简介: 《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(2)

《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(1) https://developer.aliyun.com/article/1226639?groupCode=ClouderaCDP


二、 HBase 迁移概览


1. 推荐的 HBase 迁移方案


将数据迁移到 CDP Private Cloud Base 部署时,必须使用 Apache HBase 复制和快照功能。


T0:设置 A 集群到 B 集群的 Replication,记录增量数据。

T1:A 集群生成快照,导出快照,获得 T1 时刻的全量数据。

T2:B 集群导入 T1 的全量快照,同时 T0 的 Replication 增量数据开始自动同步。

T3:Replication 增量数据逐渐消费完,业务面暂停写入。

T4:Replication 数据完全消费完,业务切换到 B 集群。

• 使用快照一次性导出/ExportSnapshot 到目的地/CloneSnapshot。

• 持续迁移:一次性方法+HBase Replication 设置。


2. 数据迁移先决条件


• 如果从 CDH 迁移,请在目标 CDP 集群中配置与现有 CDH 集群中的 HBase ACL对应的 Ranger ACL。

• 如果从 HDP 迁移,请在目标 CDP 集群中配置与现有 HDP 集群中的 HBase ACL或Ranger ACL 对应的 Ranger ACL。

• 迁移应用程序以使用新的 HBase-Spark Connector,因为 CDP 不再支持在 CDH或HDP 中使用的 Spark-HBase Connector。

• 查看从 HDP 2.x 或 CDH 5.x 升级到 CDP 时不推荐使用的 API 和不兼容(CDH6/HDP3 基本上没问题)。

• 确保升级前所有数据都迁移到支持的数据块编码类型。

• 确保手动升级任何外部的或第三方的协处理器,因为在升级期间它们不会自动升级。


3. HBase 数据迁移步骤


在迁移数据之前,必须在 CDP PvC Base 上创建一个 Apache HBase 集群。CDH 或HDP 集群是源集群,CDP PvC Base 集群是目标集群。


1) 在源集群和目标集群上部署 HBase Replication。


2) 通过对要在 HBase Shell 中复制的每个表运行以下命令,在源集群和目标集群上启用复制:


• 在源集群上

create 't1',{NAME=>'f1', REPLICATION_SCOPE=>1}

• 在目标集群上

create 't1',{NAME=>'f1', KEEP_DELETED_CELLS=>'true'}


注:建议在目标集群中的列族上启用 KEEP_DELETED_CELLS,其中源集群中的REPLICATION_SCOPE=1。


3) 在源集群的 HBase Shell 中运行 add_peer 命令,将目标集群添加为 peer:


add_peer 'ID', 'DESTINATION_CLUSTER_KEY'

注:可以从 Cloudera Manager(CM)访问的 HBase Master 用户界面获取

DESTINATION_CLUSTER_KEY 值。


4) 在源集群的 HBase Shell 中运行 disable_peer(“”)命令来禁用源集群中的 peer:


disable_peer("ID1")


5) 在 Cloudera Manager 中拍摄快照(UI/BDR/Hbase shell 命令行)。


6) 在源集群的 HBase Shell 中运行 ExportSnapshot 命令,将源集群的快照导出到


目标集群,必须以 HBase 用户或拥有文件的用户身份运行 ExportSnapshot 命令:

hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot

-copy-to hdfs://destination:hdfs_port/hbase -

mappers 16


注:必须在源集群和目标集群上启用快照。导出快照时,表的 HFile、日志和快照元

数据将从源集群复制到目标集群。


7) 在源集群的 HBase Shell 中运行 enable_peer(“”)以启用源集群和目标集群中的 peer:


enable_peer("ID1")


8) 在目标集群恢复快照:


restore_snapshot 'student_snapshot’


9) 后续增量数据会自动利用 replication 功能同步到目标集群中。


10) 数据同步完成后,需要将源端的 peer 给 disable 掉,这时数据就不再继续同步:


disable_peer("ID1")


4. HBase 数据迁移步骤(少量数据)


在源集群上运行 HashTable 命令,在目标集群上运行 SyncTable 命令,以验证表数据在源集群和目标集群之间是否同步:

• 在源集群上

HashTable [options]  

• 在目标集群上

SyncTable [options]  


《CDP企业数据云平台从入门到实践》——HBase 迁移到 CDP(3) https://developer.aliyun.com/article/1226634?groupCode=ClouderaCDP

目录
相关文章
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
427 1
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
864 0
|
存储 分布式数据库 数据库
Hbase学习二:Hbase数据特点和架构特点
Hbase学习二:Hbase数据特点和架构特点
673 0
|
缓存 监控 Shell
如何使用 HBase Shell 进行数据的实时监控和备份?
如何使用 HBase Shell 进行数据的实时监控和备份?
391 5
|
Shell 分布式数据库 Hbase
如何使用 HBase Shell 进行数据的批量导入和导出?
如何使用 HBase Shell 进行数据的批量导入和导出?
1200 5
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
安全 Linux 网络安全
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
越来越多的个人和企业希望将部署在其他云平台或者IDC企业的业务迁移到阿里云上,对于这部分用户来说,最为关注的问题就是迁移到阿里云有没有什么优惠,迁移过程是否麻烦,针对这部分用户的需求,阿里云推出了5亿算力补贴,针对迁移用户做出补贴优惠,在迁移过程中,用户可以自行做数据传输迁移,也可以使用阿里云的服务器迁移中心,快速完成迁移。本文为大家介绍其他云服务商的业务迁移到阿里云最新优惠政策,以及使用服务器迁移中心实现快速迁移的方法。
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
|
缓存 监控 Shell
使用 HBase Shell 进行数据的实时监控和备份
使用 HBase Shell 进行数据的实时监控和备份
624 6
|
Shell 分布式数据库 Hbase
使用 HBase Shell 进行数据的批量导入和导出
使用 HBase Shell 进行数据的批量导入和导出
1438 6
|
存储 NoSQL 分布式数据库
【HBase入门与实战】一文搞懂HBase!
该文档介绍了HBase,一种高吞吐量的NoSQL数据库,适合处理大规模数据。HBase具备快速读写、列式存储和天然支持集群部署的特点,常用于高并发场景。NoSQL与关系型数据库的主要区别在于数据模型、查询语言和可伸缩性。HBase的物理架构包括Client、Zookeeper、HMaster和RegionServer,其中RegionServer管理数据存储。HBase的读写流程利用MemStore和Bloom Filter提高效率。此外,文档还提到了HBase的应用,如时间序列数据、消息传递和内容服务。
3896 2
【HBase入门与实战】一文搞懂HBase!

热门文章

最新文章

下一篇
开通oss服务