oracle 哈希查询与嵌套查询跟表的先后关系测试

简介: 1  测试的内容 本次测试数据库两种连接类型哈希连接与嵌套连接跟表的顺序的关系;   1.

本次测试数据库两种连接类型哈希连接与嵌套连接跟表的顺序的关系;

 

1.1  测试的方法

构造两个数量级别悬殊的两个堆栈比表,通过hint来执行,实现不同的表的连接顺序,检查相应的执行计划;

 

1.2  测试的环境

1、表的信息:

A1100万条记录;

A210条记录;

2、执行的语句:

select  *  from wu.test4 b ,wu.test2 a   where b.object_id=a.object_id

3、以上两个表均收集了统计信息;

2  两表哈希连接的测试

1、  使用A1(大表)做构造表,A2(小表)做探测表;(数据库先执行A1,然后执行A2

2、  使用A2做构造表,A1做探测表;(数据库先执行A2,然后执行A1

2.1  测试1的执行计划

PLAN_TABLE_OUTPUT
Plan hash value: 3406100614

-----------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |TempSpc| Cost (%CPU)| Time |
-----------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 174 | 17748 | | 10339 (1)| 00:02:05 |
|* 1 | HASH JOIN | | 174 | 17748 | 118M| 10339 (1)| 00:02:05 |
| 2 | TABLE ACCESS FULL| A1 | 1133K| 105M| | 4429 (1)| 00:00:54 |
| 3 | TABLE ACCESS FULL| A2 | 11 | 44 | | 3 (0)| 00:00:01 |
-----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

1 - access("A1"."OBJECT_ID"="A2"."OBJECT_ID"
)

 

总结耗时:125S

 

2.2  测试2的执行计划

PLAN_TABLE_OUTPUT

Plan hash value: 1713954154

---------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 174 | 17748 | 4439 (1)| 00:00:54 |
|* 1 | HASH JOIN | | 174 | 17748 | 4439 (1)| 00:00:54 |
| 2 | TABLE ACCESS FULL| A2 | 11 | 44 | 3 (0)| 00:00:01 |
| 3 | TABLE ACCESS FULL| A1 | 1133K| 105M| 4429 (1)| 00:00:54 |
---------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

1 - access("A1"."OBJECT_ID"="A2"."OBJECT_ID"
)

总结总耗时:54S

 

 

 

 

 

 

 

 

3、  使用A1(大表)做构造表,A2(小表)做探测表;(数据库先执行A1,然后执行A2

4、  使用A2做构造表,A1做探测表;(数据库先执行A2,然后执行A1

 

 

3.1  测试1的执行计划

脚本:如下

EXPLAIN PLAN FOR

 select   /*+leading(A2 A1) use_Nl(A1)  use_Nl(A2)*/*

 from A1,A2

 WHERE A1.OBJECT_ID=A2.OBJECT_ID

---------------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

---------------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      |   176 | 19712 | 51589   (2)| 00:10:20 |

|   1 |  NESTED LOOPS      |      |   176 | 19712 | 51589   (2)| 00:10:20 |

|   2 |   TABLE ACCESS FULL| A2   |    11 |   154 |     2   (0)| 00:00:01 |

|*  3 |   TABLE ACCESS FULL| A1   |    16 |  1568 |  4690   (2)| 00:00:57 |

---------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   3 - filter("A1"."OBJECT_ID"="A2"."OBJECT_ID")

总结:耗时620S

 

3.2  测试2的执行计划

---------------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

---------------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      |   176 | 19712 |   316K  (1)| 01:03:17 |

|   1 |  NESTED LOOPS      |      |   176 | 19712 |   316K  (1)| 01:03:17 |

|   2 |   TABLE ACCESS FULL| A1   |  1147K|   107M|  4691   (2)| 00:00:57 |

|*  3 |   TABLE ACCESS FULL| A2   |     1 |    14 |     0   (0)| 00:00:01 |

---------------------------------------------------------------------------

Predicate Information (identified by operation id):

--------------------------------------------------

   3 - filter("A1"."OBJECT_ID"="A2"."OBJECT_ID")

总结:耗时3600S以上;

 

1、  无论进行哈希连接还是嵌套循环连接的时候,选择结果小的表都要先执行;

2、  连接条件没有选择性的时候,哈希连接的速度会比嵌套循环连接的速度快,因为哈希连接只要运行一次就可以了,而嵌套循环连接需要运行多次(由外表的结果决定)

相关原理: 1. 一张小表被hash在内存中。因为数据量小,所以这张小表的大多数数据已经驻入在内存中,剩下的少量数据被放置在临时表空间中;

2. 每读取大表的一条记录,就和小表中内存中的数据进行比较,如果符合,则立即输出数据(也就是说没有读取临时表空间中的小表的数据)。而如果大表的数据与小表中临时表空间的数据相符合,则不直接输出,而是也被存储临时表空间中。

3. 当大表的所有数据都读取完毕,将临时表空间中的数据以其输出。 如果小表的数据量足够小(小于hash area size),那所有数据就都在内存中了,可以避免对临时表空间的读写。

相关文章
|
8月前
|
Oracle 关系型数据库 Linux
【YashanDB 知识库】通过 dblink 查询 Oracle 数据时报 YAS-07301 异常
客户在使用 YashanDB 通过 yasql 查询 Oracle 数据时,遇到 `YAS-07301 external module timeout` 异常,导致 dblink 功能无法正常使用,影响所有 YashanDB 版本。原因是操作系统资源紧张,无法 fork 新子进程。解决方法包括释放内存、停掉不必要的进程或增大进程数上限。分析发现异常源于 system() 函数调用失败,返回 -1,通常是因为 fork() 失败。未来 YashanDB 将优化日志信息以更好地诊断类似问题。
|
7月前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的闪回版本查询
本文介绍了Oracle数据库的闪回版本查询(Flashback Version Query)功能,通过示例详细讲解了其使用方法。闪回版本查询可获取指定时间区间内行的不同版本,利用`versions between`子句实现。文中包含视频讲解,并通过创建测试表、插入数据及执行查询等步骤,演示如何获取历史版本信息和伪列详情,帮助用户深入了解该功能的实际应用。
130 13
|
6月前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的闪回事务查询
Oracle数据库的闪回事务查询(Flashback Transaction Query)是闪回版本查询的扩充,可用于审计或撤销已提交的事务。通过`flashback_transaction_query`视图,可生成还原特定事务的SQL语句。本文介绍了其基本概念,并通过实战演示如何使用该功能:从授权、开启UNDO数据增强,到创建测试表和事务,最后利用闪回查询撤销已提交的事务,验证数据恢复效果。附带视频讲解,帮助深入理解。
139 3
|
7月前
|
Oracle 关系型数据库 Linux
【YashanDB知识库】通过dblink查询Oracle数据时报YAS-07301异常
【YashanDB知识库】通过dblink查询Oracle数据时报YAS-07301异常
|
7月前
|
Oracle 关系型数据库 MySQL
【YashanDB知识库】oracle dblink varchar类型查询报错记录
这篇文章主要介绍了 Oracle DBLINK 查询崖山 DB 报错的相关内容,包括 ODBC 安装配置、数据源配置、dblink 环境配置、问题原因分析及规避方法。问题原因是 dblink 连接其他数据库时 varchar 类型转换导致的,还介绍了 long 类型限制、char 等类型区别,规避方法是修改参数 MAX_STRING_SIZE 支持 32K。
|
7月前
|
Oracle 关系型数据库 MySQL
使用崖山YMP 迁移 Oracle/MySQL 至YashanDB 23.2 验证测试
这篇文章是作者尚雷关于使用崖山YMP迁移Oracle/MySQL至YashanDB 23.2的验证测试分享。介绍了YMP的产品信息,包括架构、版本支持等,还详细阐述了外置库部署、YMP部署、访问YMP、数据源管理、任务管理(创建任务、迁移配置、离线迁移、校验初始化、一致性校验)及MySQL迁移的全过程。
|
8月前
|
Oracle 关系型数据库 Linux
【YashanDB 知识库】通过 dblink 查询 Oracle 数据时报 YAS-07301 异常
某客户在使用 YashanDB 通过 yasql 查询 Oracle 数据时,遇到 `YAS-07301 external module timeout` 异常,导致 dblink 功能无法正常使用,影响所有版本。问题源于操作系统资源紧张,无法 fork 新子进程。解决方法包括释放内存、停掉不必要的进程或增大进程数上限。分析发现异常原因为系统调用 fork() 失败。经验总结:优化日志记录,提供更多异常信息。
|
9月前
|
Oracle 关系型数据库 数据库
【YashanDB知识库】oracle dblink varchar类型查询报错记录
在使用Oracle DBLink查询VARCHAR类型数据时,可能会遇到多种报错。通过了解常见错误原因,采取合适的解决方法,可以有效避免和处理这些错误。希望本文提供的分析和示例能帮助你在实际工作中更好地处理DBLink查询问题。
224 10
|
9月前
|
SQL Oracle 关系型数据库
如何在 Oracle 中配置和使用 SQL Profiles 来优化查询性能?
在 Oracle 数据库中,SQL Profiles 是优化查询性能的工具,通过提供额外统计信息帮助生成更有效的执行计划。配置和使用步骤包括:1. 启用自动 SQL 调优;2. 手动创建 SQL Profile,涉及收集、执行调优任务、查看报告及应用建议;3. 验证效果;4. 使用 `DBA_SQL_PROFILES` 视图管理 Profile。
|
12月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
173 4

推荐镜像

更多