快速了解Oracle哈希连接

数据库 Oracle
这里介绍要使Oracle哈希连接有效,需要设置HASH_JOIN_ENABLED=TRUE,缺省情况下该参数为TRUE,另外,不要忘了还要设置 hash_area_size参数。

在向大家详细介绍Oracle哈希连接之前,首先让大家了解下Oracle读取row source,然后全面介绍Oracle哈希连接,希望对大家有用。在NESTED LOOPS连接中,Oracle读取row source1中的每一行,然后在row sourc2中检查是否有匹配的行,所有被匹配的行都被放到结果集中,然后处理row source1中的下一行。

这个过程一直继续,直到row source1中的所有行都被处理。这是从连接操作中可以得到第一个匹配行的最快的方法之一,这种类型的连接可以用在需要快速响应的语句中,以响应速度为主要目标。

如果driving row source(外部表)比较小,并且在inner row source(内部表)上有唯一索引,或有高选择性非唯一索引时,使用这种方法可以得到较好的效率。NESTED LOOPS有其它连接方法没有的的一个优点是:可以先返回已经连接的行,而不必等待所有的连接操作处理完才返回数据,这可以实现快速的响应时间。

如果不使用并行操作,最好的驱动表是那些应用了where 限制条件后,可以返回较少行数据的的表,所以大表也可能称为驱动表,关键看限制条件。对于并行查询,我们经常选择大表作为驱动表,因为大表可以充分利用并行功能。当然,有时对查询使用并行操作并不一定会比查询不使用并行操作效率高,因为最后可能每个表只有很少的行符合限制条件,而且还要看你的硬件配置是否可以支持并行(如是否有多个CPU,多个硬盘控制器),所以要具体问题具体对待。

NL连接的例子:

  1. SQL> explain plan for  
  2. select a.dname,b.sql  
  3. from dept a,emp b  
  4. where a.deptno = b.deptno;  
  5. Query Plan  
  6. SELECT STATEMENT [CHOOSE] Cost=5 
  7. NESTED LOOPS  
  8. TABLE ACCESS FULL DEPT [ANALYZED]  
  9. TABLE ACCESS FULL EMP [ANALYZED] 

Oracle哈希连接(Hash Join, HJ)

这种连接是在oracle 7.3以后引入的,从理论上来说比NL与SMJ更高效,而且只用在CBO优化器中。

较小的row source被用来构建hash table与bitmap,第2个row source被用来被hansed,并与第一个row source生成的hash table进行匹配,以便进行进一步的连接。Bitmap被用来作为一种比较快的查找方法,来检查在hash table中是否有匹配的行。特别的,当hash table比较大而不能全部容纳在内存中时,这种查找方法更为有用。这种连接方法也有NL连接中所谓的驱动表的概念,被构建为hash table与bitmap的表为驱动表,当被构建的hash table与bitmap能被容纳在内存中时,这种连接方式的效率极高。

HASH连接的例子:

  1. SQL> explain plan for  
  2. select /*+ use_hash(emp) */ empno  
  3. from emp, dept  
  4. where emp.deptno = dept.deptno;  
  5. Query Plan  
  6. SELECT STATEMENT [CHOOSE] Cost=3 
  7. HASH JOIN  
  8. TABLE ACCESS FULL DEPT  
  9. TABLE ACCESS FULL EMP 

要使Oracle哈希连接有效,需要设置HASH_JOIN_ENABLED=TRUE,缺省情况下该参数为TRUE,另外,不要忘了还要设置 hash_area_size参数,以使Oracle哈希连接高效运行,因为Oracle哈希连接会在该参数指定大小的内存中运行,过小的参数会使Oracle哈希连接的性能比其他连接方式还要低。

总结一下,在哪种情况下用哪种连接方法比较好:

排序 - - 合并连接(Sort Merge Join, SMJ):
a) 对于非等值连接,这种连接方式的效率是比较高的。
b) 如果在关联的列上都有索引,效果更好。
c) 对于将2个较大的row source做连接,该连接方法比NL连接要好一些。
d) 但是如果sort merge返回的row source过大,则又会导致使用过多的rowid在表中查询数据时,数据库性能下降,因为过多的I/O。

【编辑推荐】

  1. 快速了解Oracle哈希连接
  2. 详细谈论Oracle表连接
  3. 分析Oracle索引扫描四大类
  4. 高手闲谈Oracle索引扫描
  5. 六分钟学会Oracle全表扫描
责任编辑:佚名 来源: NET130
相关推荐

2009-11-17 09:47:54

Oracle SQL语

2015-08-26 16:17:49

OpenStack OpenStack 架开源云平台

2021-09-15 07:46:42

哈希一致性哈希算法

2016-12-30 13:43:35

异步编程RxJava

2021-11-22 22:14:46

JavaScript开发模块

2022-08-04 18:50:12

Navigator浏览器设备

2023-11-06 09:24:14

CSS相对颜色

2010-11-19 16:22:14

Oracle事务

2010-01-12 10:23:52

路由最佳路径

2009-11-12 10:05:09

Visual C++

2010-11-15 10:40:58

Oracle启动参数

2010-11-15 13:20:06

Oracle恢复结构

2010-10-29 15:37:51

Oracle物理结构

2010-10-25 15:04:39

Oracle文本函数

2010-10-28 13:20:50

ORACLE reso

2010-10-25 09:39:43

Oracle FBI索

2009-11-16 17:41:46

Oracle数据块

2010-10-26 11:55:21

Oracle OS备份

2010-10-27 16:22:07

Oracle层次查询

2009-11-17 09:31:06

Oracle Dual
点赞
收藏

51CTO技术栈公众号