《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(2)

简介: 《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(2)

《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(1) https://developer.aliyun.com/article/1227685?groupCode=ClouderaCDP


二、 使用 Replication Manager 迁移 Hive 数据

image.png

Replication Manager 于整个 CDH/CDP 平台的数据灾难恢复,它提供整的数据灾难恢能。在界面上可以选择源和目置,然后选需要复的文件、、库。可以户、资源监控、日常等信息,可以根据度策略进行数据过程中可以进监控情况,并


Repliation Manager 也支持和数据复制。要支持 HDFS Hbase,数据复制要支持 HDFS Hive。在 Hive 数据复制了支持 HDFS 数据复制支持了数据的复制以Sentry Ranger 年的版本会新支持 Hive 数据迁移的复制。


1. RM 迁移注意点

image.png

进行 Hive 数据时,CDH CDP 迁移议在 CDP Hive 将 Hive置成 CDH 的受管,数据动迁移到该目下,代码修改目录即行。


受管CDH 迁移CDP 后会变成 CDP 增加 purge 性,能够在做理的时将数据文件进行 drop,从保证CDH 相同使用体验。CDP 不支持 Repliation Manager年的版本会增加对应的支持。同时,Repliation Manager 支持 Sentry 限迁移Ranger户可以根据自己的求迁移


Repliation Manager CM 的版求较高,在 CDH 上需要将 CM 到版本 6.3以上,CDH 在版5.10 以上。CDH 本较通过 Distcp+HMS Mirror 的方式来同Hive 数据。目标集群要CDP 7.0 以上,能支持 HDFS Sentry Ranger 限迁移,支持 Hive Hive 部表迁移等CDP CM 和 CDH的版7.1.1 以上,支持高密度的文件部表的数据迁移


《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(3) https://developer.aliyun.com/article/1227681?groupCode=ClouderaCDP

目录
相关文章
|
4月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
141 1
|
1月前
|
SQL 物联网 数据处理
"颠覆传统,Hive SQL与Flink激情碰撞!解锁流批一体数据处理新纪元,让数据决策力瞬间爆表,你准备好了吗?"
【8月更文挑战第9天】数据时代,实时性和准确性至关重要。传统上,批处理与流处理各司其职,但Apache Flink打破了这一界限,尤其Flink与Hive SQL的结合,开创了流批一体的数据处理新时代。这不仅简化了数据处理流程,还极大提升了效率和灵活性。例如,通过Flink SQL,可以轻松实现流数据与批数据的融合分析,无需在两者间切换。这种融合不仅降低了技术门槛,还为企业提供了更强大的数据支持,无论是在金融、电商还是物联网领域,都将发挥巨大作用。
39 6
|
2月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
14天前
|
SQL 关系型数据库 HIVE
实时计算 Flink版产品使用问题之如何将PostgreSQL数据实时入库Hive并实现断点续传
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
14天前
|
SQL 分布式计算 数据处理
实时计算 Flink版产品使用问题之怎么将数据从Hive表中读取并写入到另一个Hive表中
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
19天前
|
SQL 分布式计算 Hadoop
Hive基本概念入门
Hive基本概念入门
15 0
|
23天前
|
SQL 存储 分布式计算
|
24天前
|
SQL 存储 监控
Hive 插入大量数据
【8月更文挑战第15天】
|
2月前
|
SQL 关系型数据库 MySQL
实时计算 Flink版操作报错合集之从mysql读数据写到hive报错,是什么原因
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

热门文章

最新文章