《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(2) https://developer.aliyun.com/article/1227813?groupCode=ClouderaCDP
2. Distcp 参数
三、 使用 Replication Manager 迁移数据
Replication Manager 是 Cloudera Manager 中的一项服务。您可以在此服务中创建复制策略,以针对各种用例跨数据中心复制数据,这些用例包括灾难恢复场景、运行混合工作负载、将数据迁移到云或从云迁移数据或通用备份/恢复场景。您还可以创建 HDFS 或 HBase 快照策略,分别对 HDFS 目录和 HBase 表进行快照。
1. Replication Manager 数据复制
Replication Manager 主要进行数据复制,用于不同集群之间的数据复制,以及本地集群和云上的数据复制,支持直接把数据写入到 S3。
2. Replication Manager 概述
Replication Manager 使您能够跨数据中心复制数据以用于灾难恢复场景。支持复制 HDFS 存储的数据、Hive 表存储的数据、Hive Metastore 数据、Hive Metastore中注册的 Impala 表的 Impala 元数据(Catalog server metadata),以及 Sentry到 Ranger 的权限。如果需要去复制 HBase,是通过 HBase shell 提供的数据迁移。
《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(4) https://developer.aliyun.com/article/1227808?groupCode=ClouderaCDP