以下的文章主要讲述的是Oracle in 与 not in在实际应用中的区别,我们大家都知道在很多相关的软件系统中,其系统的实际性能在很大程度上是由数据库的相关性能所决定。以前也曾经做过很多次关于性能方面的各种测试。
特别是关于Oracle的,我想到也应该记录下来一部分,为大家共享。
事情发生在我们的系统从sqlserver移植到Oracle,用户在一个查询的操作上等待的时间无法忍受了,我们关于这个查询的处理与原来的方式一下,难道sqlserver 同Oracle有什么地方不一样么,让我们来看看Oracle有什么地方有问题,或者是我们使用的有问题?
业务问题大概可以这样描述,一个父表,一个子表,查询的结果是找到子表中没有使用父表id的记录,这种情况估计很多系统都会牵涉得到。让我们来举一个例子:
表一: 父表 parent
表二: 子表 childen
父表存储父亲,子表存储孩子,然后通过pid和父表关联,查询需要的结果是找到尚未有孩子的父亲。
我们来看一下查询语句的写法:
- select * from parent where id not in (select pid from childen)
这种标准的写法在子表存在50万条的记录的时候,查询时间超过了10秒,远远大于原来的sql server服务器的一秒。我在解决的时候想到了一个方法:
- select * from parent where id in
- ( select id from parent minus select pid from childen )
正常理解下,这个语句应该更加费时,但是事实完全出乎意料,这条语句不仅仅在子表存在大量记录的情况下速度良好,在子表少量数据的情况下速度也非常的好,基本在1秒内完成。
这个结果可以很明显的证明Oracle 在子查询的内部处理的时候,使用 Oracle in 和 not in 的巨大区别,希望用到这种方式的用户注意,也期待有人解释其中的问题。
【编辑推荐】
- Oracle10g中current_scn的正确计算运行
- 用Oracle SQL语句来实现进制间的相互转换
- Oracle数据库中的(+)连接如何操作?
- Oracle 10G数据库中软硬件环境有哪些要求?
- Oracle 10g的即时客户端与PHP的安装