《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(1)

简介: 《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(1)


HDFS 迁移到 CDP

一、 HDFS 迁移方案介绍

1. HDFS 迁移常见工具

在进行 HDFS 迁移时,第一个使用比较广工具Hadoop 迁移工具

DistCP第二个是经过加工强的 Cloudera Replication Manager

2. 工具功能比较

image.png

对这两个工具进行比较


使用方式


DistCP 要是通过行命的方式行,Replication Manager 要是通CM 界面简单的方式提供给户。


安全支持


DistCP 要支持Kerberos 群间、Kerberos 群到 Kerberos 群、Kerberos群到 Kerberos 群的迁移Replication Manager 支持。



DistCP 通过Replication Manager 通过方提供整的监控运行时可以历史告记


和全支持


DistCP Replication Manager 都支持,要是利用快比较增量


周期性运行


DistCP 要是一行,通过调器来执行周期性的度策略。Replication

Manager 可以在界面上提供立即执行、一行和周期性行的度策略。所有行策略都提供对应行日程,可以更监控


范围


DistCP 比较广,于所有的 Hadoop 群、CDHHDPHadoopCDP,以HDFS 的数据迁移Replication Manager 要支持 CDH CDHCDH 到 CDPCDP CDP 的数据迁移,要使用 Replication Manager 需要 Cloudera 许可证。


《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(2) https://developer.aliyun.com/article/1227813?groupCode=ClouderaCDP


目录
相关文章
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
38 4
|
1月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
33 2
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
82 0
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
37 0
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
46 0
|
3月前
|
SQL 存储 分布式计算
HDFS数据(跨集群)迁移
HDFS数据(跨集群)迁移
|
4月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
4月前
|
分布式计算 Hadoop
|
4月前
|
分布式计算 Hadoop 关系型数据库
实时计算 Flink版操作报错合集之Hadoop在将文件写入HDFS时,无法在所有指定的数据节点上进行复制,该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
5月前
|
存储 分布式计算 Hadoop
Hadoop的HDFS数据均衡
【6月更文挑战第13天】
236 3

热门文章

最新文章