Hive Tuning(三) 从查询计划看hive.auto.convert.join的好处

简介: 《Hive Tunning》读后小记第二篇——(四) 从查询计划看hive.auto.convert.join的好处
今天我们来讲一下如何看懂Hive的查询计划。
hive的执行计划包括三部分:
– Abstract syntax tree – 可以直接忽略  
– Stage dependencies – 依赖 
– Stage plans – hive如何执行任务的信息。
e8bc385635b48c30eda02e23b450e30c2e29cbe0
下面还是以一个案例作为说明
8f513921972ef28a83fba0eb5f77d1cec820ceb1
设置自动连接为false的话,要走5步。
537d4630adcd877247be8419c935c61aeeb64240
4 Map Reduces tells you something is not right.  
    Stage:    Stage-1    
                Map    Reduce    
    Stage:    Stage-2    
                Map    Reduce    
    Stage:    Stage-3    
                Map    Reduce    
    Stage:    Stage-4    
                Map    Reduce   
设置自动连接为true就只有4步
e24c3d142387fc4a2ec58402d38979d980ba1aee
Only 2 Map Reduces  
    Stage:    Stage-8    
                Map    Reduce    
    Stage:    Stage-4    
                Map    Reduce
7f873296b36f19fd5c148a61dd7711f80df55d0d
hive直接就加载了要做连接的表,client和path表,其中client表做了过滤,剩下的map/reduce是用来连接和排序的。
目录
相关文章
|
SQL 分布式计算 Hadoop
Hive使用Impala组件查询(1)
Hive使用Impala组件查询(1)
714 0
|
SQL 存储 分布式数据库
【通过Hive清洗、处理和计算原始数据,Hive清洗处理后的结果,将存入Hbase,海量数据随机查询场景从HBase查询数据 】
【通过Hive清洗、处理和计算原始数据,Hive清洗处理后的结果,将存入Hbase,海量数据随机查询场景从HBase查询数据 】
650 0
|
SQL HIVE
Hive分区+根据分区查询
Hive分区+根据分区查询
|
12月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
177 4
|
12月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
140 2
|
SQL 存储 大数据
Hive的查询、数据加载和交换、聚合、排序、优化
Hive的查询、数据加载和交换、聚合、排序、优化
447 2
|
SQL 资源调度 数据库连接
Hive怎么调整优化Tez引擎的查询?在Tez上优化Hive查询的指南
在Tez上优化Hive查询,包括配置参数调整、理解并行化机制以及容器管理。关键步骤包括YARN调度器配置、安全阀设置、识别性能瓶颈(如mapper/reducer任务和连接操作),理解Tez如何动态调整mapper和reducer数量。例如,`tez.grouping.max-size` 影响mapper数量,`hive.exec.reducers.bytes.per.reducer` 控制reducer数量。调整并发和容器复用参数如`hive.server2.tez.sessions.per.default.queue` 和 `tez.am.container.reuse.enabled`
1259 0
|
SQL 存储 关系型数据库
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
1616 0
|
SQL 分布式计算 Java
Hive【Hive(三)查询语句】
Hive【Hive(三)查询语句】
|
SQL 存储 大数据
大数据Hive Join连接查询
大数据Hive Join连接查询
438 0