MySQL: 喂,别走,听我解释一下好吗?

数据库 MySQL
现在的互联网应用也好,传统应用也罢,不管开发语言是什么,涉及到关系型数据库,MySQL 基本都是不二之选。

[[332345]]

MySQL:先别跑好吗?

程序员:不跑你养我啊?

MySQL:你听我给你「解释」啊。

程序员:你先管好你自己吧。

现在的互联网应用也好,传统应用也罢,不管开发语言是什么,涉及到关系型数据库,MySQL 基本都是不二之选。

在 Java 的开发框架里, MyBatis 可以自定义 SQL,ORM/JPA 会根据对象映射,自动生成一系列相关的 SQL。至于自动生成的SQL,甚至自定义的SQL 执行效率到底高不高,不用 select *, 增加 where 条件,避免查全量数据等等,我们开发人员可能基本都是根据现有的知识储备,在大脑里过滤一遍,至于到底 SQL 是否高效执行,却从来没有去问过MySQL 一句。

而实际上,SQL语句写完,这项工作完成了还不到一半,其余还需要评估我们SQL写的质量如何,执行效率够不够高。MySQL 像一位智者一样,一直待在那里,只要你问,知无不言。重点在于,你不要急着走,要听他解释一下。

Explain

在 MySQL 中,我们一般常用 desc tableName 来查看一张表的信息,各个列的定义等、通过 Explain SQL 来了解MySQL 是如何执行当前这条SQL的 。

实际上 desc、describe、explain 都可以用来查看MySQL 是如何执行当前这条SQL的,在 MySQL 8.0.19 之后,这三者的作用可以说是等价的,explain 也可以用来查看表信息。后面我们会直接以 explain 为例,来说明具体的作用。

官方文档说的明白, explain 可以和SELECT、INSERT、UPDATE、DELETE 一起工作,显示 MySQL 优化器的语句执行计划,即用来告诉用户 MySQL 会怎样执行这条 SQL,以什么样的顺序,如果是多表的话是怎样 Join的。

输出字段官网文档截图如下:

 

上面返回看似不少,不过我们重点关注 type、key、rows 这三个。

我们常见应用的场景都是读多写少,而且对于 SQL 的执行的效率评估,一般也是说从已经存储的十成、百万甚至千万条数据中查询需要数据的效率。

后面以 SELECT 为例,来看看 explain 能带给我们什么帮忙和建议。

假设有如下表定义及数据:

  1. CREATE TABLE `t3` ( 
  2.   `id` int NOT NULL
  3.   `a` int DEFAULT NULL
  4.   `b` int DEFAULT NULL
  5.   PRIMARY KEY (`id`), 
  6.   KEY `a` (`a`) 
  7. ) ENGINE=InnoDB; 
  8.  
  9. delimiter ;; 
  10. create procedure idata() 
  11. begin  
  12.   declare i int
  13.   set i=1; 
  14.   while(i<=100000) do 
  15.     insert into t3 values(i,i,i);  
  16.     set i=i+1; 
  17.     end while; 
  18.   end;; 
  19. delimiter ; 
  20. call idata(); 

执行完上述SQL,我们来试想一下,在当前十万行数据的表中如果执行一条查询SQL,那在少量数据中查找一定比全表查找要快很好。

比如我们最熟悉的通过主键查询

  1. select a from t3 where id=100; 

你会发现,explain 中 type 是 const, key 是 PRIMARY

 

再比如执行

  1. select  * from t3 where b=100; 

这个时候, explain 告诉我们,查询类型是ALL,全表扫描:

 

如果我们是想要把这个表里全部数据显示也就罢了,目前只查一条数据却执行全表扫描,explain 告诉我们扫描行可能会到9万多行,效率可想而知。

如果我们把SQL 改成这样:

  1. select * from t3 where a=100; 

此时 explain 变成了这样:

 

你会发现,type 变成了 ref, key 变成了a, rows 是1, 区别只在于 a 列上建立了索引,此时扫描行数变成了一行,差别太明显了。

如果我们要查找一个范围内的数据,通过主键或者包含索引的列进行查询时,

 

扫描的还是有限行,此时type是range,但如果还是通过 b 做为条件进行过滤,那还是全表扫描:

 

另外,为什么一般的SQL优化建议里都会说别用 select * ,指定具体用到的列呢?

肯定是用到什么列的数据查什么数据更节省内存,传输,不要等到查出结果再在内存里进行过滤,此外更重要的一点是,每个创建的索引,都有自己的索引树,能够在索引树上完成查询操作,就不需要再回表去查询,效率当然会更高。

比如,我们把查询换成了

  1. select a,id from t3 where a < 100; 

此时,explain 会在Extra里告诉咱们,查询的时候没有回表,用到了index

 

如果把查询列改成星,这个时候,就需要回表了,

 

咱们前面说重点关注 type, key, rows,可以再看下 Extra, type 里查询效率从优到差,有

const

表中只有一行匹配,查询一次即可满足。常用来匹配主键或者唯一索引。

eq_ref

唯一索引

ref

非唯一索引

range

通过一个索引去查询,只扫描指定范围内的行。一般是在检索列中包含 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, LIKE, or IN()

index

类似于全表扫描,区别在于只扫描索引树

all

全表扫描,效率最低的。

在 MySQL 8.0.18 开始,还加入了一个 explain analyze,可以查看具体预计SQL执行耗时,比如我们通过它来查看上面的几个命令,会有如下输出,你会更直观的感觉到加了索引带来的效率提升。

 

是不是很明显?

所有,你听到MySQL 又在和你说了吗?

『小伙子,你慢些走。有事没事听我给你先解释解释,说道说道啊』

 

小结一下,通过 explain,我们能在执行前就从 MySQL的优化器拿到对于当前 SQL 的执行计划,了解执行中至少会扫描多少行,是否会使用到索引,大致会用多少时间等,这样该加索引加索引,该改SQL就改SQL,这样做到心中有数,应用的性能会更心中有数。

本文转载自微信公众号「Tomcat那些事儿」,可以通过以下二维码关注。转载本文请联系Tomcat那些事儿公众号。

 

责任编辑:武晓燕 来源: Tomcat那些事儿
相关推荐

2021-08-28 09:06:11

Dubbo架构服务

2011-01-18 13:45:58

2020-02-28 09:09:51

闭包函数作用域

2023-05-22 10:09:21

FlexboxCSS3

2020-08-13 08:43:24

TCP固定窗口滑动窗口

2021-08-02 07:59:21

单调栈题目

2021-08-02 07:59:47

技术动图数列

2019-01-02 11:22:27

HTTPFTPSMTP

2024-07-29 08:28:00

模型AI

2022-06-29 11:01:05

MySQL事务隔离级别

2021-04-21 14:19:52

javaignalHandle接口

2011-07-26 18:22:42

MySQL Workb数据库

2023-02-02 07:06:10

2020-12-10 08:44:35

WebSocket轮询Comet

2009-11-17 11:14:25

Oracle扩展

2021-12-27 18:00:30

对象数组Java

2022-03-24 13:36:18

Java悲观锁乐观锁

2010-03-17 17:33:47

云计算

2021-12-18 20:46:38

亚马逊云科技阿里云IaaS

2024-02-21 16:42:00

点赞
收藏

51CTO技术栈公众号