《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(2)

简介: 《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(2)

《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(1) https://developer.aliyun.com/article/1227685?groupCode=ClouderaCDP


二、 使用 Replication Manager 迁移 Hive 数据

image.png

Replication Manager 于整个 CDH/CDP 平台的数据灾难恢复,它提供整的数据灾难恢能。在界面上可以选择源和目置,然后选需要复的文件、、库。可以户、资源监控、日常等信息,可以根据度策略进行数据过程中可以进监控情况,并


Repliation Manager 也支持和数据复制。要支持 HDFS Hbase,数据复制要支持 HDFS Hive。在 Hive 数据复制了支持 HDFS 数据复制支持了数据的复制以Sentry Ranger 年的版本会新支持 Hive 数据迁移的复制。


1. RM 迁移注意点

image.png

进行 Hive 数据时,CDH CDP 迁移议在 CDP Hive 将 Hive置成 CDH 的受管,数据动迁移到该目下,代码修改目录即行。


受管CDH 迁移CDP 后会变成 CDP 增加 purge 性,能够在做理的时将数据文件进行 drop,从保证CDH 相同使用体验。CDP 不支持 Repliation Manager年的版本会增加对应的支持。同时,Repliation Manager 支持 Sentry 限迁移Ranger户可以根据自己的求迁移


Repliation Manager CM 的版求较高,在 CDH 上需要将 CM 到版本 6.3以上,CDH 在版5.10 以上。CDH 本较通过 Distcp+HMS Mirror 的方式来同Hive 数据。目标集群要CDP 7.0 以上,能支持 HDFS Sentry Ranger 限迁移,支持 Hive Hive 部表迁移等CDP CM 和 CDH的版7.1.1 以上,支持高密度的文件部表的数据迁移


《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(3) https://developer.aliyun.com/article/1227681?groupCode=ClouderaCDP

目录
相关文章
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
284 1
|
SQL 关系型数据库 MySQL
Hive跨集群和版本迁移
Hive跨集群和版本迁移
|
SQL 分布式计算 大数据
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门
305 0
|
SQL 分布式计算 资源调度
阿里云MaxCompute-Hive作业迁移语法兼容性踩坑记录
阿里云MaxCompute-Hive作业迁移语法兼容性踩坑记录
1679 0
|
SQL 存储 大数据
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念
245 0
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
495 0
|
7月前
|
SQL DataX HIVE
【YashanDB知识库】DataX迁移Hive到崖山分布式
本文来自YashanDB官网,介绍通过DataX将Hive数据迁移到YashanDB的实现方法。源环境为Hive 3.1.3,目标为YashanDB 23.2.3.100。文章提供了Hive与YashanDB的建表脚本、数据类型映射及DataX配置示例,包含reader和writer插件参数设置,并通过`datax.py`执行同步任务。内容详尽展示了数据迁移的全流程。
【YashanDB知识库】DataX迁移Hive到崖山分布式
|
12月前
|
SQL 分布式计算 关系型数据库
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
292 3
|
12月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
287 0
|
SQL 分布式计算 Hadoop
Hive基本概念入门
Hive基本概念入门
417 0

热门文章

最新文章