提升查询技能,这7条SQL查询错误必须解决

数据库 SQL Server
本文将指出一些常见但却总是被忽略的错误,请静下心来,准备好提升查询技能吧!

 本文转载自公众号“读芯术”(ID:AI_Discovery)

 本文将指出一些常见但却总是被忽略的错误,请静下心来,准备好提升查询技能吧!

[[377879]]

让我们以一个虚构的业务为例。假设你是亚马逊电子商务分析团队的一员,需要运行几个简单的查询。你手头有两个表,分别为“product(产品)”和“discount (折扣)”。

 

提升查询技能,这7条SQL查询错误必须解决

 

1.计算NULL字段的数目

为了计算null字段的数目,要掌握COUNT函数的工作原理。假设计算产品数量时,要求计入表格“product”的“product id”主键列中遗漏的字段。

 

  1. SELECT COUNT(product_id) 
  2. FROM product;Result: 3 

 

由于要求计入“product id”列中的null值,查询结果应该为4,但COUNT()函数不会将null值计数。

解决方法:使用COUNT(*)函数。该函数可以将null值计数。

 

  1. Select Count(*) 
  2. From product;Result: 4 

 

这个操作很简单,但是在编写复杂的查询时总会被忽略。

2.使用保留字作为列名

 

  1. SELECT product_id, 
  2. RANK() OVER (ORDER BY price descAs Rank 
  3. FROM product; 

 

由于列名“Rank”是Rank函数的保留字,该查询结果出错。

解决方法:

 

  1. SELECT product_id, 
  2. RANK() OVER (ORDER BY price descAs ‘Rank’ 
  3. FROM product; 

 

加上单引号,即可得到想要的结果。

3.NULL的比较运算

 

  1. SELECT product_name 
  2. FROM product 
  3. WHERE product_id=NULL

 

由于使用了比较运算符“=”,此处运算会出现异常,使用另一比较运算符“!=”运算也会出现异常。这里的逻辑问题在于,你编写的查询得出的是“product id”列的值是否未知,而无法得出这一列的值是否是未知的产品。

解决方法:

 

  1. SELECT product_name 
  2. FROM product 
  3. WHERE product_id ISNULL

 

4.ON子句过滤和WHERE子句过滤的区别

这是一个非常有趣的概念,会提高你对于ON子句过滤和WHERE子句过滤之间区别的基本理解。这并不完全是一个错误,只是演示了两者的用法,你可以根据业务需求选择最佳方案。

 

  1. SELECT d.product_id, 
  2. price, 
  3. discount 
  4. FROM product p RIGHT JOIN discount d ON 
  5. p.product_id=d.product_id 
  6. WHERE p.product_id>1; 

 

结果:

 

提升查询技能,这7条SQL查询错误必须解决

 

在这种情况下,过滤条件在两个表格连接之后生效。因此,所得结果不包含d.product_id≤1的行(同理,显然也不包含p.product≤1的行)。

解决方法:使用AND,注意结果上的不同。

 

  1. SELECT d.product_id, 
  2. price, 
  3. discount 
  4. FROM product p RIGHT JOIN discount d ON 
  5. p.product_id=d.product_id 
  6. AND p.product_id>1; 

 

结果:

 

提升查询技能,这7条SQL查询错误必须解决

 

在这里,条件语句AND在两个表格连接发生之前计算。可以把此查询看作只适用于一个表(“product”表)的WHERE子句。现在,由于右连接,结果中出现了d.product_id≤1的行(显然还有p.product_id>1的行)。

请注意,ON子句过滤和WHERE子句过滤只在左/右/外连接时不同,而在内连接时相同。

5.在同一查询的WHERE子句中使用Windows函数生成的列&使用CASE WHEN子句

注意,不要在同一查询的WHERE子句中使用通过Windows函数生成的列名以及CASE WHEN子句。

 

  1. SELECT product_id, 
  2. RANK() OVER (ORDER BY price descAS rk 
  3. FROM product 
  4. WHERE rk=2; 

 

因为列rk由Windows函数生成,并且在同一查询的WHERE子句中使用了该列,这个查询结果会出现异常。

解决方法:这一问题可以通过使用临时表或者子查询解决。

 

  1. WITH CTE AS 
  2. SELECT product_id, 
  3.  
  4.  
  5.  
  6.  
  7. RANK() OVER (ORDER BY price descAS rk 
  8. FROM product 
  9. SELECT product_id 
  10. FROM 
  11. CTE 
  12. WHERE rk=2; 

 

 

  1. SELECT product_id 
  2. FROM 
  3. SELECT product_id, 
  4. RANK() OVER (ORDER BY price descAS rk 
  5. FROM product; 
  6. WHERE rk=2; 

 

同样的方法也适用于使用CASE WHEN子句创建的列。请记住,Windows函数只能出现在SELECT或ORDER BY子句中。

6.BETWEEN的使用不正确

如果不清楚BETWEEN的有效范围,也许会得不到想要的查询结果。BETWEEN x AND y语句的有效范围包含x和y。

 

  1. SELECT * 
  2. FROM discount 
  3. WHERE offer_valid_till BETWEEN ‘2019/01/01’ AND ‘2020/01/01’ 
  4. ORDER BY offer_valid_till; 

 

结果:

 

提升查询技能,这7条SQL查询错误必须解决

 

在查询中,也许我们只想得到2019年的所有日期,但是结果中还包含了2020年1月1日。这是因为BETWEEN语句的有效范围包含2019/01/01和2020/01/01。

解决方法:相应地调整范围可以解决这个问题。

 

  1. SELECT * 
  2. FROM discount 
  3. WHERE offer_valid_till BETWEEN ‘2019/01/01’ AND ‘2019/12/31’ 
  4. ORDER BY offer_valid_till; 

 

结果:

 

提升查询技能,这7条SQL查询错误必须解决

 

现在,所有查询结果均为2019年的日期。

7.在GROUP BY语句后使用WHERE子句

在编写GROUP BY语句时,请注意WHERE子句的位置。

 

  1. SELECT category, 
  2. AVG (price) 
  3. FROM product p INNER JOIN discount d ON 
  4. p.product_id=d.product_id 
  5. GROUP BY category 
  6. WHERE discount_amount>10; 

 

由于将WHERE子句放在GROUP BY语句后,此查询是错误的。这是为什么呢?

WHERE子句用于过滤查询结果,这一步要在将查询结果分组之前实现,而不是先分组再过滤。正确的做法是先应用WHERE条件过滤减少数据,再使用GROUP BY子句通过聚合函数将数据分组(此处使用聚合函数AVG)。

解决方法:

 

  1. SELECT category, 
  2. AVG (price) 
  3. FROM product p INNER JOIN discount d ON 
  4. p.product_id=d.product_id 
  5. WHERE discount_amount>10 
  6. GROUP BY category; 

 

请注意主要SQL语句的执行顺序:

  • FROM 子句
  • WHERE 子句
  • GROUP BY 子句
  • HAVING 子句
  • SELECT 子句
  • ORDER BY 子句

以上包含了大部分让人不解的错误,尤其是对初学者而言。正如亨利·福特所说:“唯一的错误是我们从中学不到任何东西”,希望这篇文章能帮助你精进查询技能。

 

责任编辑:华轩 来源: 读芯术
相关推荐

2023-12-05 07:45:35

SQL数据库

2011-02-23 13:26:01

SQL查询优化

2021-06-16 14:40:46

CIO首席信息官IT领导者

2024-08-19 00:40:00

SQL数据库

2024-07-10 09:07:09

2024-02-22 10:36:13

SELECT 语句PostgreSQL数据查询

2017-12-05 13:41:02

SQL数据库SQL查询

2014-07-29 10:09:40

iwatch

2024-01-02 18:01:12

SQLSELECT查询

2011-08-24 11:22:38

SQL ServerUNION代替OR

2010-06-22 10:00:31

SQL查询

2022-02-11 14:43:53

SQL语句C/S架构

2017-01-10 11:32:19

2009-01-14 09:16:24

SQL Server查SQL Server查SQL Server

2019-12-03 18:51:36

SQL数据库MySQL

2010-09-26 15:29:13

sql查询分页

2011-07-07 14:22:24

SQL查询update

2020-12-03 08:00:00

SQL数据库MySQL

2023-09-25 13:15:50

SQL数据库

2024-10-11 16:51:02

点赞
收藏

51CTO技术栈公众号