《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(3)

简介: 《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(3)

《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(2) https://developer.aliyun.com/article/1227683?groupCode=ClouderaCDP


二、 使用 Replication Manager 迁移 Hive 数据


2. 使用 RM 迁移 Hive 演示

image.png

image.png

示的环境版本如上图所示。

image.png

CDH群中有Hive中三test对应ORC

Parquet式,示需要将三testCDH5迁移CDP,并进行一

image.png

,进行复制,迁移CDH5的数据。群中行,需要点击--加同行,才能继续

image.png

行的Cloudera Manager果启TLS对应口为71837180使用认的账户和行管理码。完成后会接,接认证之可在复制时在不同集群中进行数据迁

image.png

行的单包括接性、编辑和

-复制-创建计-Hive复制。

image.png

填写以上规信息

HDFS存储Hive数据和数据的可项,是创建表的根目。比如HDFS的目/mypathuser/hive/warehouse/bdr.db/tab1

那么复制/mypath/user/hive/warehouse/bdr.db/tab1

image.png


填写以上资源信息中,复制策略为小集合中的文件复制任务mapper完后再理下一个指根据文件大小实一分

image.png

image.png

image.png

image.png

令详信息具体信息

image.png

从上图信息中可以到,Hive数据复制分为6

第一步:Hive Metastore

第二步:数据文件。

第三步:Hive数据复制,HDFS数据复制,、文件列举文件、将行中,并在目端触HDFS的复制务。

步:Hive Metastore入。

步:通过引发Impala shellInvalidate

步:在目端重Snapshots使其变为可

image.png

历史记行结。图中示了费时间为2分,复制了3期文件3个,失败文件。

复制文件是已经存在。

image.png

此时目已经变为/data/user/hive/warehouse,下面有3,意味着复制成

image.png

default库下也已经存在三。此处发生了几个变化:

第一,的性变为“EXTERNAL”部表

第二,变为/data/user/hive/warehouse

第三,增加external.table.purge性,做数据理的时文件一起删

通过Replication Manager迁移Hive有以下几个

需要企业的许可证。

数据迁移HiveCDP变为表同purge性。

增量数据动创建快,需要在Hive动快。通过比较快的方式对应增量来同增量数据,以减少数据


《CDP企业数据云平台从入门到实践》——Hive 迁移到 CDP(4) https://developer.aliyun.com/article/1227680?groupCode=ClouderaCDP


目录
相关文章
|
7月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
166 1
|
7月前
|
SQL 关系型数据库 MySQL
Hive跨集群和版本迁移
Hive跨集群和版本迁移
|
SQL 分布式计算 资源调度
阿里云MaxCompute-Hive作业迁移语法兼容性踩坑记录
阿里云MaxCompute-Hive作业迁移语法兼容性踩坑记录
1292 0
|
7月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
245 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
87 3
|
5月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
7月前
|
安全 Linux 网络安全
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
越来越多的个人和企业希望将部署在其他云平台或者IDC企业的业务迁移到阿里云上,对于这部分用户来说,最为关注的问题就是迁移到阿里云有没有什么优惠,迁移过程是否麻烦,针对这部分用户的需求,阿里云推出了5亿算力补贴,针对迁移用户做出补贴优惠,在迁移过程中,用户可以自行做数据传输迁移,也可以使用阿里云的服务器迁移中心,快速完成迁移。本文为大家介绍其他云服务商的业务迁移到阿里云最新优惠政策,以及使用服务器迁移中心实现快速迁移的方法。
其他云平台的业务迁移到阿里云最新优惠,使用服务器迁移中心SMC快速迁移简介
|
7月前
|
SQL 数据可视化 Apache
阿里云数据库内核 Apache Doris 兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移
阿里云数据库 SelectDB 内核 Doris 的 SQL 方言转换工具, Doris SQL Convertor 致力于提供高效、稳定的 SQL 迁移解决方案,满足用户多样化的业务需求。兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移。
阿里云数据库内核 Apache Doris 兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移
|
7月前
|
存储 JSON 监控
云上之旅:将内网网络监控软件迁移到AWS云平台
在当今数字化时代,企业对于网络监控的需求愈发迫切。为了更好地管理内网网络,许多企业选择将监控软件迁移到云平台。本文将介绍如何将内网网络监控软件迁移到AWS云平台,并探讨监控到的数据如何自动提交到网站。
271 0
|
SQL 数据采集 存储
Hive SQL 迁移 Flink SQL 在快手的实践
快手数据架构工程师张芒,阿里云工程师刘大龙,在 Flink Forward Asia 2022 生产实践专场的分享。
743 1
Hive SQL 迁移 Flink SQL 在快手的实践