《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(1)

简介: 《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(1)


HDFS 迁移到 CDP

一、 HDFS 迁移方案介绍

1. HDFS 迁移常见工具

在进行 HDFS 迁移时,第一个使用比较广工具Hadoop 迁移工具

DistCP第二个是经过加工强的 Cloudera Replication Manager

2. 工具功能比较

image.png

对这两个工具进行比较


使用方式


DistCP 要是通过行命的方式行,Replication Manager 要是通CM 界面简单的方式提供给户。


安全支持


DistCP 要支持Kerberos 群间、Kerberos 群到 Kerberos 群、Kerberos群到 Kerberos 群的迁移Replication Manager 支持。



DistCP 通过Replication Manager 通过方提供整的监控运行时可以历史告记


和全支持


DistCP Replication Manager 都支持,要是利用快比较增量


周期性运行


DistCP 要是一行,通过调器来执行周期性的度策略。Replication

Manager 可以在界面上提供立即执行、一行和周期性行的度策略。所有行策略都提供对应行日程,可以更监控


范围


DistCP 比较广,于所有的 Hadoop 群、CDHHDPHadoopCDP,以HDFS 的数据迁移Replication Manager 要支持 CDH CDHCDH 到 CDPCDP CDP 的数据迁移,要使用 Replication Manager 需要 Cloudera 许可证。


《CDP企业数据云平台从入门到实践》——HDFS 迁移到 CDP(2) https://developer.aliyun.com/article/1227813?groupCode=ClouderaCDP


目录
相关文章
|
13天前
|
SQL 存储 分布式计算
HDFS数据(跨集群)迁移
HDFS数据(跨集群)迁移
|
2月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
2月前
|
分布式计算 Hadoop
|
2月前
|
分布式计算 Hadoop 关系型数据库
实时计算 Flink版操作报错合集之Hadoop在将文件写入HDFS时,无法在所有指定的数据节点上进行复制,该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
3月前
|
存储 分布式计算 Hadoop
Hadoop的HDFS数据均衡
【6月更文挑战第13天】
134 3
|
4月前
|
安全 Linux 网络安全
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
越来越多的个人和企业希望将部署在其他云平台或者IDC企业的业务迁移到阿里云上,对于这部分用户来说,最为关注的问题就是迁移到阿里云有没有什么优惠,迁移过程是否麻烦,针对这部分用户的需求,阿里云推出了5亿算力补贴,针对迁移用户做出补贴优惠,在迁移过程中,用户可以自行做数据传输迁移,也可以使用阿里云的服务器迁移中心,快速完成迁移。本文为大家介绍其他云服务商的业务迁移到阿里云最新优惠政策,以及使用服务器迁移中心实现快速迁移的方法。
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
|
4月前
|
存储 分布式计算 Hadoop
hadoop节点HDFS数据分片过程
【5月更文挑战第18天】
46 1
|
4月前
|
存储 分布式计算 Hadoop
|
4月前
|
存储 分布式计算 资源调度
|
3月前
|
消息中间件 分布式计算 关系型数据库
使用Apache Spark从MySQL到Kafka再到HDFS的数据转移
使用Apache Spark从MySQL到Kafka再到HDFS的数据转移