T-SQL查询进阶之深入理解子查询

数据库 SQL Server
本文深入解释了T-SQL子查询的一些重点知识,并通过实例对介绍的子查询方法进行验证,相信会对您有所帮助。

子查询本质上是嵌套进其他SELECT,UPDATE,INSERT,DELETE语句的一个被限制的SELECT语句,在子查询中,只有下面几个子句可以使用:SELECT子句(必须)、FROM子句(必选)、 WHERE子句(可选)  、GROUP BY(可选) 、HAVING(可选) 和ORDER BY(只有在TOP关键字被使用时才可用)。

子查询也可以嵌套在其他子查询中,这个嵌套最多可达32层。子查询也叫内部查询(Inner query)或者内部选择(Inner Select),而包含子查询的查询语句也叫做外部查询(Outter)或者外部选择(Outer Select),子查询的概念可以简单用下图阐述:

T-SQL查询进阶之深入理解子查询

T-SQL查询进阶之深入理解子查询

http://wiki.lessthandot.com/index.php/Subquery_typo_with_using_in。这篇文章的观点是永远不要再用IN和NOT IN关键字,我的观点是存在即合理,我认为只有在IN里面是固定值的时候才可以用IN和NOT IN,比如:

T-SQL查询进阶之深入理解子查询

上图是作为数据源使用的一个子查询。

通常来讲,子查询按照子查询所返回数据的类型,可以分为三种,分别为:

返回一张数据表(Table)

返回一列值(Column)

返回单个值(Scalar)

下面,我们按照这三种方式来阐述子查询

子查询作为数据源使用

当子查询在外部查询的FROM子句之后使用时,子查询被当作一个数据源使用,即使这时子查询只返回一个单一值(Scalar)或是一列值(Column),在这里依然可以看作一个特殊的数据源,即一个二维数据表(Table).作为数据源使用的子查询很像一个View(视图),只是这个子查询只是临时存在,并不包含在数据库中。

比如这个语句:

  1. SELECT P.ProductID, P.Name, P.ProductNumber, M.Name  
  2.  
  3. AS ProductModelName  
  4.  
  5. FROM Production.Product AS P  
  6.  
  7. INNER JOIN  
  8.  
  9. (  
  10.  
  11. SELECT Name, ProductModelID  
  12.  
  13. FROM Production.ProductModel)  
  14.  
  15. AS M  
  16.  
  17. ON P.ProductModelID = M.ProductModelID 

上述子查询语句将ProductModel表中的子集M,作为数据源(表)和Product表进行内连接。结果如下:

作为数据源使用也是子查询最简单的应用。当然,当子查询作为数据源使用时,也分为相关子查询和无关子查询,这会在文章后面介绍到.

子查询作为选择条件使用

作为选择条件的子查询也是子查询相对最复杂的应用.

作为选择条件的子查询是那些只返回一列(Column)的子查询,如果作为选择条件使用,即使只返回单个值,也可以看作是只有一行的一列.比如,在AdventureWorks中:我想取得总共请病假天数大于68小时的员工:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact]  
  8.  
  9. WHERE ContactID IN  
  10.  
  11. (SELECT EmployeeID  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee]  
  14.  
  15. WHERE SickLeaveHours>68) 

结果如下:

T-SQL查询进阶之深入理解子查询

上面的查询中,在IN关键字后面的子查询返回一列值作为外部查询的选择条件使用。

同样的,与IN关键字的逻辑取反的NOT IN关键字,这里就不再阐述了。

但是要强调的是,不要用IN和NOT IN关键字,这会引起很多潜在的问题,这篇文章对这个问题有着很好的阐述:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact]  
  8.  
  9. WHERE ContactID IN (25,33) 

只有在上面这种情况下,使用IN和NOT IN关键字才是安全的,其他情况下,最好使用EXISTS,NOT EXISTS,JOIN关键字来进行替代. 除了IN之外,用于选择条件的关键字还有ANY和ALL,这两个关键字和其字面意思一样. 和"<",">",”="连接使用,比如上面用IN的那个子查询:

我想取得总共请病假天数大于68小时的员工

用ANY关键字进行等效的查询为:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact]  
  8.  
  9. WHERE ContactID =ANY 
  10.  
  11. SELECT EmployeeID  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee]  
  14.  
  15. WHERE SickLeaveHours>68) 

在作为ANY和ALL关键字在子查询中使用时,所实现的效果如下:

=ANY 和IN等价
<>ANY 和NOT IN等价
>ANY 大于最小的(>MIN)
<ANY 小于最大的(<MAX)
>ALL 大于最大的(>MAX)
<ALL 小于最小的(<MIN)
=ALL 下面说

=ALL关键字很少使用,这个的效果在子查询中为如果只有一个返回值,则和“=”相等,而如果有多个返回值,结果为空。

这里要注意,SQL是一种很灵活的语言,就像子查询所实现的效果可以使用JOIN来实现一样(效果一样,实现思路不同),ANY和ALL所实现的效果也完全可以使用其他方式来替代,按照上面表格所示,>ANY和>MIN完全等价,比如下面两个查询语句完全等价:

  1. SELECT *  
  2.  
  3. FROM AdventureWorks.HumanResources.Employee  
  4.  
  5. WHERE SickLeaveHours>ANY  
  6.  
  7. (SELECT SickLeaveHours  
  8.  
  9. FROM AdventureWorks.HumanResources.Employee  
  10.  
  11. WHERE SickLeaveHours>68)  
  12.  
  13. SELECT *  
  14.  
  15. FROM AdventureWorks.HumanResources.Employee  
  16.  
  17. WHERE SickLeaveHours> 
  18.  
  19. (SELECT MIN(SickLeaveHours)  
  20.  
  21. FROM AdventureWorks.HumanResources.Employee  
  22.  
  23. WHERE SickLeaveHours>68) 

 #p#

相关子查询和EXISTS关键字

前面所说的查询都是无关子查询(Uncorrelated subquery),子查询中还有一类很重要的查询是相关子查询(Correlated subquery),也叫重复子查询比如,还是上面那个查询,用相关子查询来写:

我想取得总共请病假天数大于68天的员工:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact] c  
  8.  
  9. WHERE EXISTS  
  10.  
  11. (SELECT *  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee] e  
  14.  
  15. WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68) 

结果和使用IN关键字的查询结果相同:

T-SQL查询进阶之深入理解子查询

如何区别相关子查询和无关子查询呢?最简单的办法就是直接看子查询本身能否执行,比如上面的例子中的子查询:

  1. (SELECT *  
  2.  
  3. FROM [AdventureWorks].[HumanResources].[Employee] e  
  4.  
  5. WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68) 

这一句本身执行本身会报错.因为这句引用到了外部查询的表。

对于无关子查询来说,整个查询的过程为子查询只执行一次,然后交给外部查询,比如:

  1. SELECT *  
  2.  
  3. FROM AdventureWorks.HumanResources.Employee  
  4.  
  5. WHERE SickLeaveHours>ANY  
  6.  
  7. SQLRESULT 

上面的无关子查询,整个查询过程可以看作是子查询首先返回SQLResult(SQL结果集),然后交给外部查询使用,整个过程子查询只执行一次。

而相反,作为相关子查询,子查询的执行的次数依赖于外部查询,外部查询每执行一行,子查询执行一次,比如:

还是上面的例子:我想取得总共请病假天数大于68天的员工:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact] c  
  8.  
  9. WHERE EXISTS  
  10.  
  11. (SELECT *  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee] e  
  14.  
  15. WHERE c.ContactID=e.ContactID AND e.SickLeaveHours>68) 

step 1:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact] c  
  8.  
  9. WHERE EXISTS  
  10.  
  11. (SELECT *  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee] e  
  14.  
  15. WHERE 1=e.ContactID AND e.SickLeaveHours>68) 

step 2:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact] c  
  8.  
  9. WHERE EXISTS  
  10.  
  11. (SELECT *  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee] e/p> 
  14.  
  15. WHERE 2=e.ContactID AND e.SickLeaveHours>68) 

step n:

  1. SELECT [FirstName]  
  2.  
  3. ,[MiddleName]  
  4.  
  5. ,[LastName]  
  6.  
  7. FROM [AdventureWorks].[Person].[Contact] c  
  8.  
  9. WHERE EXISTS  
  10.  
  11. (SELECT *  
  12.  
  13. FROM [AdventureWorks].[HumanResources].[Employee] e  
  14.  
  15. WHERE n=e.ContactID AND e.SickLeaveHours>68) 

如上面代码所示。上面的相关子查询实际上会执行N次(N取决与外部查询的行数),外部查询每执行一行,都会将对应行所用的参数传到子查询中,如果子查询有对应值,则返回TRUE(既当前行被选中并在结果中显示),如果没有,则返回FALSE。然后重复执行下一行。

子查询作为计算列使用

当子查询作为计算列使用时,只返回单个值(Scalar) 。用在SELECT语句之后,作为计算列使用。同样分为相关子查询和无关子查询

相关子查询的例子比如:我想取得每件产品的名称和总共的销量。

  1. SELECT [Name],  
  2.  
  3. (SELECT COUNT(*) FROM AdventureWorks.Sales.SalesOrderDetail S  
  4.  
  5. WHERE S.ProductID=P.ProductID)AS SalesAmount  
  6.  
  7. FROM [AdventureWorks].[Production].[Product] P 

部分结果如下:

当子查询作为计算列使用时,会针对外部查询的每一行,返回唯一的值。

同样的,SQL子查询都可以使用其他语句达到同样的效果,上面的语句和如下语句达到同样的效果:

  1. SELECT P.Name,COUNT(S.ProductID)  
  2.  
  3. FROM [AdventureWorks].[Production].[Product] P  
  4.  
  5. LEFT JOIN AdventureWorks.Sales.SalesOrderDetail S  
  6.  
  7. ON S.ProductID=P.ProductID  
  8.  
  9. GROUP BY P.Name 

子查询作为计算列且作为无关子查询时使用,只会一次性返回但一值,这里就不再阐述了。

【编辑推荐】

  1. 误删SQL Server日志文件后怎样附加数据库
  2. 如何配置Oracle 10g oem中的主机身份证明
  3. 详解Lotus Domino数据库关键数据的保护(一)
  4. 详解Lotus Domino数据库关键数据的保护(二)
  5. SQL Server 2005数据库用户权限管理的设置
责任编辑:赵鹏 来源: 博客园
相关推荐

2011-10-19 10:07:16

T-SQL查询变量

2011-08-24 16:36:00

T-SQL

2011-08-23 13:36:11

T-SQL查询流程控制语句

2021-09-10 07:31:54

AndroidAppStartup原理

2023-12-16 13:14:00

SQL子查询技术

2021-09-24 08:10:40

Java 语言 Java 基础

2021-09-08 06:51:52

AndroidRetrofit原理

2017-08-08 09:15:41

前端JavaScript页面渲染

2021-10-15 09:19:17

AndroidSharedPrefe分析源码

2021-02-17 11:25:33

前端JavaScriptthis

2021-09-18 06:56:01

JavaCAS机制

2021-08-24 07:53:28

AndroidActivity生命周期

2011-08-12 10:31:01

T-SQL查询基于列的逻辑表达式

2017-04-21 11:24:13

数据库Azure T-SQL编辑器

2021-09-17 06:55:50

AndroidLayoutView

2021-09-16 06:44:04

Android进阶流程

2014-07-15 17:17:31

AdapterAndroid

2022-08-02 14:11:50

nucleiWorkflowsMathcer

2025-01-13 07:30:00

SQL开发组合查询

2022-09-05 22:22:00

Stream操作对象
点赞
收藏

51CTO技术栈公众号