《CDP企业数据云平台从入门到实践》——Hive3 新特性 (1)

简介: 《CDP企业数据云平台从入门到实践》——Hive3 新特性 (1)

Hive3 新特性


一、 Hive3 的新功能


1. Hive3 的新功能


1) 性能提升


SQL 兼容

Hive3 支持大多数最新的 ANSI SQL2016 准。


ACID v2

相比 Hive2 ACID v1v2 文件、Stats、性能方面都有了大提升。


查询 Caching

单元过滤似或相同查询Hive 计算的数据,数百个或数BI 工具Web 服务的查询 Hive 时,查询可以大大减少负载。


视图

多个查询经需要相同的中间,所以可以通过将中间预先计算和缓存到图中昂贵复的查询部分共


Hive on Tez

Hive3 计算引擎使用 Hive on Tez通过来计算,性能是 Hive2 50 倍;


2) 务特性


查询


JDBC 联邦


动后 Hive JDBC 数据源创建两个数据库:information_schema sys

所有 Metastore 映射间中,并且在 sys 中可

information_schema 数据统状态,类似于 sys 数据库数据,可以使

SQL 查询来查询 information_schema


Kafka Connector Cloud Connectors作组件存储和应用


3) 表优

Hive3 格控制了文件计算机存资源,提性能的可测性以安全性。


使用 ACID 取的文件,于之的存储

Hive3 的文件移动比 Hive2 减少多。

数据和数据减少对文件


4) Spark

可以使用 Hive Spark 应用序查询数据,Hive Warehouse ConnectorHWC)支持从 Spark 取和Hive 数据。


2. 升级挑战:访问模式的更改


1) 更高的安全性


KNOX 代理接访问。

支持 SSL 访问。

整的 Kerberos

IDM 成(许多服务的 PAM

通过 KNOX

授权模型方面:CDP RangerHive 强制Ranger 的访问控制,与安全方案相比,为模型提供更强的安全性,并且在管理策略方面提供更大的灵活此模型仅Hive 访问数据库。未启Ranger 安全服务或安全性,则默情况下,Hive 根据户模使用 CDP 数据中心基于存储的授权

HDFS :在 CDP 数据中心中,于存储的授权重依HDFS 访问控列表ACL),ACL HDFS 展,情况CDP 数据中心在 HDFS ACL


2) Hive 自身变


HS2 vs. CLIBeeline):Hive Hive Sever 通过 Hive Sever 2 提供访问,时,Hive CLI Beeline 取代。

Hive1 Hive2 ,在 Hive3 中需要进行整。

新的比如认结构等

SQL 强制(CBO 进)。

版的整。

取模式整:比如小文件取。

JDBC/ODBC 更新。

JDBC/ODBC 访问制。

资源映射

托管v1 v2)。

ACL DDL)。


3) Spark

访问托管Spark 不能接访问 Hive 托管,需要通过 HWC 进行,通过 HWC Spark 访问 Hive ACID 部表通过 HWC

件升1.x 2.x)。

更安全的环境。

存储翻译层

数据位置。


3. 功能变化


托管使用 V2 针对的文件式产生不作用,在默认位置方面都整。

库位置:分托管部表,以获得更的治理准。

安全:有模方式,使用方式访问。

数据安全治理:通过 ACL 整合和方式成。

LLAPCDP 有云和公有云版中提供,Base 不提供 LLAP

JDBC 更新。


4. 功能移除


引擎支持 Hive on MR/Spark,由 Hive on Tez 行。

Hive CONCAT使用 ACID

Hive Indexes使用物图代

Hive CLI使用 Beeline

Tez View DAS Hue

Oozie HiveAction Hive2Action


《CDP企业数据云平台从入门到实践》——Hive4 新特性 (2) https://developer.aliyun.com/article/1228366?groupCode=ClouderaCDP

目录
相关文章
|
6月前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
163 1
|
6月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
222 0
|
SQL 存储 资源调度
Hive3新特性 2
Hive3新特性
213 0
Hive3新特性 2
|
SQL 分布式计算 Hadoop
Hive3新特性 1
Hive3新特性
218 0
|
SQL 安全 大数据
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (1)
676 0
|
弹性计算 分布式计算 安全
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (2)
300 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
269 0
|
机器学习/深度学习 消息中间件 监控
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (4)
273 0
|
6月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
191 1
|
1月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
35 0