HIVE

首页 标签 HIVE
# HIVE #
关注
5954内容
SQL 数据库查询的优化工具及实用
这是MaxCompute有关SQL优化器原理的系列文章之一,本文主要是对数据库查询优化器的一个综述,包括: 查询优化器定义、分类 查询优化器执行过程 CBO框架Calcite简介 1.查询优化器是什么 数据库主要由三部分组成,分别是解析器、优化器和执行引擎,如下图所示: 其中优化器是数据库中用于把关系表达式转换成执行计划的核心组件,很大程度上决定了一个系统的性能。
修改代码150万行!与 Blink 合并后的 Apache Flink 1.9.0 究竟有哪些重大变更?
早在今年1月,阿里便宣布将内部过去几年打磨的大数据处理引擎 Blink 进行开源并向 Apache Flink 贡献代码。Flink 1.9.0 版本在结构上有重大变更,修改代码达 150 万行,本文将梳理 Flink 1.9.0 中非常值得关注的重大变更与新增功能特性。
[Hive]Union使用指南
1. union语法 select_statement UNION [ALL | DISTINCT] select_statement UNION [ALL | DISTINCT] select_statement ... UNION将多个SELECT语句的结果集合并为一个独立的结果集。
利用 sparksession读取Parquet,Json格式文件
Spark支持的一些常见的格式: 文本文件:无任何的格式 json文件:半结构化 parquet:一种流行的列式存储格式 sequencefile:一种(k-v)的Hadoop文件格式.
书评:《大数据处理之道》大数据热门技术遍历
《大数据处理之道》,用深入浅出的语言,系统的讲解了当前流行的大数据软件Hadoop, Spark, Storm, Dremel/Drill,MapReduce, HDFS, Hive, Hbase, Pig, ZooKeeper等等,涵盖了目前几乎所有的大数据热门技术,十分推荐!
Flume1.8用户手册中文版的翻译终于在今天完成了
今天刚刚终于把Flume1.8的用户手册翻译完了,稍后再审阅核对一遍应该就算告一段落了,刚准备翻译的时候最新的版本是1.8,如今Flume1.9都已经发布了,不过不用担心Flume版本的变化并不大,应该说整个1.x版本都差不多,新版本只不过是在往上面加一些新的组件和一些bug修复。
免费试用