《CDP企业数据云平台从入门到实践》——Hive3 新特性 (2)

简介: 《CDP企业数据云平台从入门到实践》——Hive3 新特性 (2)

《CDP企业数据云平台从入门到实践》——Hive5 新特性 (1) https://developer.aliyun.com/article/1228367?groupCode=ClouderaCDP


二、 Hive3 的变更细节


1. Hive MetastoreHMS)转换层


许在各种 Metastore 户之间安全共数据,HiveSpark Impala

个客户技术(HiveSpark Impala)都支持取和入数据源的能列

Metastore 这些功能与所表相中存在不兼容,Metastore将客户提出异常并终止对表信息


成中使用 NON-IMPERSONATION),doas=false 方式。


2. 通过翻译层进行规范化的副作用


Hive Metastore HDP 3.1.5 中可包括 CDP-PvC Base 7.1+


数据库”LOCATION 使用LOCATION 部表中可而在托管中不可,从历史HDP 3.1.4),它制了托管的基本目现在(HDP 3.1.5 + CDP-PvC Base 7.1),它代位置的默基本

托管基本位置,可以通过数据库的“MANAGEDLOCATION”进行控制(仅CDP 7.1+)。

ACID 托管https://issues.apache.org/jira/browse/HIVE-22158


3. 更改托管(ACID)表的默认位置


CDP Runtime 7.1 中可(不在 HDP 3 中)。

件:


doas=false),“hive”级用户需要该位置的 RW 访问

SHOW DATABASE 示托管位置。

image.png

4. 结构转换为 Hive Metastore


Hive Spark 创建Hive Metastore 翻译整,并在存储以匹配公认的最和术

image.png

Hive 创建 CREATE Table 创建支持 ACID 的托管,需要文件格式是ORC

Hive 和在 Spark 创建 CREATE EXTERNAL 创建这种的表结和数据是分的,DROP Table 数据然存在。

Spark 创建 CREATE 创建 EXTERNAL/PURGE 这种表表格式和数据是一的,DROP Table ,数据也跟着

部表可以PURGE托管)。


5. Hive1 Hive3 会话


引擎Hive on MR 迁移Hive on TEZ 的,查会阻碍 TEZ 旧会话配置。

Hive on TEZ 的,CBO 已经成熟,许多置可能会产生影响


以下


查询置的它们并重试,在

查统计数据,并在要时这些数据。

期进行 Rebalance,整合文件。


《CDP企业数据云平台从入门到实践》——Hive3 新特性 (3) https://developer.aliyun.com/article/1228362?groupCode=ClouderaCDP

目录
相关文章
|
5月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
156 1
|
5月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
211 0
|
5月前
|
数据库连接 API 网络架构
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
在 Excel 里使用 ODBC 读取云平台上 CDS view 的数据
|
SQL 存储 资源调度
Hive3新特性 2
Hive3新特性
200 0
Hive3新特性 2
|
SQL 分布式计算 Hadoop
Hive3新特性 1
Hive3新特性
207 0
|
SQL 安全 大数据
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
665 0
|
弹性计算 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
288 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
260 0
|
5月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
182 1
|
13天前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
18 0