到底什么是MySQL执行计划吗?

数据库 MySQL
当我们工作到了一定的年限之后,一些应该掌握的知识点,我们是必须需要去了解的,比如今天面试官问的SQL执行计划,看懂了这篇文章你就会知道这都不是事,让我们一起来揭晓这里面的奥妙

[[395437]]

面试官说:工作这么久了,应该知道sql执行计划吧,讲讲Sql的执行计划吧!看了看面试官手臂上纹的大花臂和一串看不懂的韩文,吞了吞口水,暗示自己镇定点,整理了一下思绪缓缓的对面试官说:我不会面试官:。。。。,回去等通知吧我:%^&%$!@#

一、前言

当我们工作到了一定的年限之后,一些应该掌握的知识点,我们是必须需要去了解的,比如今天面试官问的SQL执行计划当我们执行一条SQL的时候,可以直接对应的结果,但是你并不晓得,它会经历多深远黑暗的隧道,通过连接器、查询缓存、分析器、优化器、执行器重重筛选,才有可能展示到我们面前,有时候当你等待N长时间,但是展现的却是 timeout,这个时候想砸电脑的心都有了,不过当你看了今天的SQL执行计划后,你再也不用砸电脑了,看懂了这篇文章你就会知道这都不是事,让我们一起来揭晓这里面的奥妙

在实际的应用场景中,为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。通常会使用explain+SQL语句来模拟优化器执行SQL查询语句,从而知道mysql是如何处理sql语句的。

官网地址: https://dev.mysql.com/doc/refman/5.5/en/explain-output.html

首先我们来下面的一条sql语句,其中会有 id、select_type、table等等这些列,这些就是我们执行计划中所包含的信息,我们要弄明白的就是这些列是用来干嘛的,以及每个列可能存在多少个值。

  1. explain select * from emp; 

 

二、执行计划中包含的信息

贴心的小农已经把sql复制出来了,只需要放到数据库中执行即可,方便简单快捷 ——牧小农

建表语句:

  1. SET FOREIGN_KEY_CHECKS=0; 
  2. DROP TABLE IF EXISTS `dept`; 
  3. CREATE TABLE `dept` ( 
  4.   `DEPTNO` int NOT NULL
  5.   `DNAME` varchar(14) DEFAULT NULL
  6.   `LOC` varchar(13) DEFAULT NULL
  7.   PRIMARY KEY (`DEPTNO`) 
  8. ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 
  9.  
  10. INSERT INTO `dept` VALUES ('10''ACCOUNTING''NEW YORK'); 
  11. INSERT INTO `dept` VALUES ('20''RESEARCH''DALLAS'); 
  12. INSERT INTO `dept` VALUES ('30''SALES''CHICAGO'); 
  13. INSERT INTO `dept` VALUES ('40''OPERATIONS''BOSTON'); 
  14.  
  15. DROP TABLE IF EXISTS `emp`; 
  16. CREATE TABLE `emp` ( 
  17.   `EMPNO` int NOT NULL
  18.   `ENAME` varchar(10) DEFAULT NULL
  19.   `JOB` varchar(9) DEFAULT NULL
  20.   `MGR` int DEFAULT NULL
  21.   `HIREDATE` date DEFAULT NULL
  22.   `SAL` double(7,2) DEFAULT NULL
  23.   `COMM` double(7,2) DEFAULT NULL
  24.   `DEPTNO` int DEFAULT NULL
  25.   PRIMARY KEY (`EMPNO`), 
  26.   KEY `idx_job` (`JOB`), 
  27.   KEY `jdx_mgr` (`MGR`), 
  28.   KEY `jdx_3` (`DEPTNO`), 
  29.   KEY `idx_3` (`DEPTNO`) 
  30. ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 
  31.  
  32. INSERT INTO `emp` VALUES ('7369''SMITH''CLERK''7902''1980-12-17''800.00'null'20'); 
  33. INSERT INTO `emp` VALUES ('7499''ALLEN''SALESMAN''7698''1981-02-20''1600.00''300.00''30'); 
  34. INSERT INTO `emp` VALUES ('7521''WARD''SALESMAN''7698''1981-02-22''1250.00''500.00''30'); 
  35. INSERT INTO `emp` VALUES ('7566''JONES''MANAGER''7839''1981-02-02''2975.00'null'20'); 
  36. INSERT INTO `emp` VALUES ('7654''MARTIN''SALESMAN''7698''1981-09-28''1250.00''1400.00''30'); 
  37. INSERT INTO `emp` VALUES ('7698''BLAKE''MANAGER''7839''1981-01-05''2850.00'null'30'); 
  38. INSERT INTO `emp` VALUES ('7782''CLARK''MANAGER''7839''1981-09-06''2450.00'null'10'); 
  39. INSERT INTO `emp` VALUES ('7839''KING''PRESIDENT'null'1981-11-17''5000.00'null'10'); 
  40. INSERT INTO `emp` VALUES ('7844''TURNER''SALESMAN''7698''1981-09-08''1500.00''0.00''30'); 
  41. INSERT INTO `emp` VALUES ('7900''JAMES''CLERK''7698''1981-12-03''950.00'null'30'); 
  42. INSERT INTO `emp` VALUES ('7902''FORD''ANALYST''7566''1981-12-03''3000.00'null'20'); 
  43. INSERT INTO `emp` VALUES ('7934''MILLER''CLERK''7782''1982-01-23''1300.00'null'10'); 
  44.  
  45. DROP TABLE IF EXISTS `emp2`; 
  46. CREATE TABLE `emp2` ( 
  47.   `id` int NOT NULL AUTO_INCREMENT, 
  48.   `empno` int DEFAULT NULL
  49.   PRIMARY KEY (`id`) 
  50. ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8; 
  51. INSERT INTO `emp2` VALUES ('1''111'); 
  52. INSERT INTO `emp2` VALUES ('2''222'); 
  53.  
  54. DROP TABLE IF EXISTS `salgrade`; 
  55. CREATE TABLE `salgrade` ( 
  56.   `GRADE` int NOT NULL
  57.   `LOSAL` double DEFAULT NULL
  58.   `HISAL` double DEFAULT NULL
  59.   PRIMARY KEY (`GRADE`) 
  60. ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 
  61.  
  62. INSERT INTO `salgrade` VALUES ('1''700''1200'); 
  63. INSERT INTO `salgrade` VALUES ('2''1201''1400'); 
  64. INSERT INTO `salgrade` VALUES ('3''1401''2000'); 
  65. INSERT INTO `salgrade` VALUES ('4''2001''3000'); 
  66. INSERT INTO `salgrade` VALUES ('5''3001''9999'); 
  67.  
  68. DROP TABLE IF EXISTS `t_job`; 
  69. CREATE TABLE `t_job` ( 
  70.   `id` int NOT NULL AUTO_INCREMENT, 
  71.   `job` varchar(9) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL
  72.   PRIMARY KEY (`id`), 
  73.   KEY `j` (`job`) 
  74. ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 

2.1 id

select查询的序列号,包含一组数字,表示查询中执行select子句或者操作表的顺序

id号分为三种情况:

1、如果id相同,那么执行顺序从上到下

  1. -- 左关联 
  2. explain selectfrom emp e left join dept d on e.deptno = d.deptno; 
  3. -- 右关联e 
  4. explain selectfrom emp e right join dept d on e.deptno = d.deptno; 

通过left join 和 right join 验证;id一样(注意执行计划的table列),left join 先扫描e表,再扫描d表;right join 先扫描d表,再扫描e表

2、如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行

  1. explain select * from emp e where e.deptno = (select d.deptno from dept d where d.dname = 'SALES'); 

在下面的表中回先查询 id 为 2的数据 也就是我们的 d表(注意:我们可以看到d表中select_type为 SUBQUERY 也就是子查询的 意思),然后根据d表中的deptno去查询 e表中的数据


3、id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行

  1. explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal where e.deptno = (select d.deptno from dept d where d.dname = 'SALES'); 

在这里先从id为2的执行,如果id是一样的,就按照顺序执行

2.2 select_type

主要用来分辨查询的类型,是普通查询还是联合查询还是子查询

  1. --simple:简单的查询,不包含子查询和union 
  2. explain selectfrom emp; 

 

  1. --primary:查询中若包含任何复杂的子查询,最外层查询则被标记为Primary 
  2. explain select * from emp e where e.deptno = (select d.deptno from dept d where d.dname = 'SALES'); 

 

  1. --union:若第二个select出现在union之后,则被标记为union 
  2. explain select * from emp where deptno = 10 union select * from emp where sal >2000; 

 

  1. --dependent union:跟union类似,此处的depentent表示union或union all联合而成的结果会受外部表影响 
  2. explain select * from emp e where e.empno in ( select empno from emp where deptno = 10 union select empno from emp where sal >2000); 

 

  1. --union result:从union表获取结果的select 
  2. explain select * from emp where deptno = 10 union select * from emp where sal >2000; 

 

  1. --subquery:在select或者where列表中包含子查询 
  2. explain selectfrom emp where sal > (select avg(sal) from emp) ; 

 

  1. --dependent subquery:subquery的子查询要受到外部表查询的影响 
  2. explain select * from emp e where e.deptno = (select distinct deptno from dept where deptno = e.deptno); 

 

  1. --DERIVED: from子句中出现的子查询,也叫做派生类, 
  2. explain select * from (select ename staname,mgr from emp where ename = 'W' union select ename,mgr from emp where ename = 'E') a; 

 

  1. -- UNCACHEABLE SUBQUERY:表示使用子查询的结果不能被缓存 
  2. explain select * from emp where empno = (select empno from emp where deptno=@@sort_buffer_size); 

 

  1. --uncacheable union:表示union的查询结果不能被缓存 
  2. explain select * from emp where exists (select 1 from dept where emp.deptno = dept.deptno union select 1 from dept where deptno = 10); 

 

2.3 table

对应行正在访问哪一个表,表名或者别名,可能是临时表或者union合并结果集 1、如果是具体的表名,则表明从实际的物理表中获取数据,也可以是表的别名

  1. explainselect*fromempwheresal>(selectavg(sal)fromemp); 

2、表名是derivedN的形式,表示使用了id为N的查询产生的衍生表

  1. explain select * from (select ename staname,mgr from emp where ename = 'WARD' union select ename staname,mgr from emp where ename = 'SMITH') a; 

derived2 :表明我们需要从衍生表2中取数据

3、当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id

  1. explain select * from emp where deptno = 10 union select * from emp where sal >2000; 

 

2.4 type

type显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:

  1. system > const > eqref > ref > fulltext > refornull > indexmerge > uniquesubquery > indexsubquery > range > index > ALL 

一般情况下,得保证查询至少达到range级别,最好能达到ref

  1. --all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。 
  2. explain select * from emp; 

 

  1. --index:全索引扫描这个比all的效率要好,主要有两种情况,一种是当前的查询时覆盖索引,即我们需要的数据在索引中就可以索取,或者是使用了索引进行排序,这样就避免数据的重排序 
  2. explain select empno from emp; 

 

  1. --range:表示利用索引查询的时候限制了范围,在指定范围内进行查询,这样避免了index的全索引扫描,适用的操作符:=, <>, >, >=, <, <=, IS NULL, BETWEEN, LIKE, or IN()  
  2. explain select * from emp where empno between 7000 and 7500; 

 

  1. --index_subquery:利用索引来关联子查询,不再扫描全表 
  2. explain select * from emp where emp.job in (select job from t_job); 
  3.  
  4. --unique_subquery:该连接类型类似与index_subquery,使用的是唯一索引  
  5. explain select * from emp e where e.deptno in (select distinct deptno from dept); 
  6.  
  7. --ref_or_null:对于某个字段即需要关联条件,也需要null值的情况下,查询优化器会选择这种访问方式 
  8. explain select * from emp e where  e.mgr is null or e.mgr=7369; 

 

  1. --ref:使用了非唯一性索引进行数据的查找 
  2. create index idx_3 on emp(deptno); 
  3. explain select * from emp e,dept d where e.deptno =d.deptno; 

 

  1. --eq_ref :使用唯一性索引进行数据查找 
  2. explain select * from emp,emp2 where emp.empno = emp2.empno; 

 

  1. --const:这个表至多有一个匹配行, 
  2. explain select * from emp where empno = 7369; 

 

  1. --system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现 

2.5 possible_keys

显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用

  1. explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; 

 

2.6 key

实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。

  1. explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; 

 

2.7 key_len

表示索引中使用的字节数,可以通过keylen计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。

1、一般地,keylen 等于索引列类型字节长度,例如int类型为4 bytes,bigint为8 bytes;

2、如果是字符串类型,还需要同时考虑字符集因素,例如utf8字符集1个字符占3个字节,gbk字符集1个字符占2个字节

3、若该列类型定义时允许NULL,其keylen还需要再加 1 bytes

4、若该列类型为变长类型,例如 VARCHAR(TEXT\BLOB不允许整列创建索引,如果创建部分索引也被视为动态列类型),其keylen还需要再加 2 bytes 字符集会影响索引长度、数据的存储空间,为列选择合适的字符集;变长字段需要额外的2个字节,固定长度字段不需要额外的字节。而null都需要1个字节的额外空间,所以以前有个说法:索引字段最好不要为NULL,因为NULL让统计更加复杂,并且需要额外一个字节的存储空间。

  1. explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; 

 

2.8 ref

显示索引的哪一列被使用了,如果可能的话,是一个常数

  1. explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; 

 

2.9 rows

根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好

  1. explain select * from emp; 

 

2.10 extra

包含额外的信息。

  1. --using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置 
  2. explain select * from emp order by sal; 

 

  1. --using temporary:建立临时表来保存中间结果,查询完成之后把临时表删除 
  2. explain select ename,count(*) from emp where deptno = 10 group by ename; 

 

  1. --using index:这个表示当前的查询时覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现using where 表名索引被用来执行索引键值的查找,如果没有,表面索引被用来读取数据,而不是真的查找 
  2. explain select deptno,count(*) from emp group by deptno limit 10; 

 

  1. --using where:使用where进行条件过滤 
  2. explain select * from emp2 where empno = 1; 

 

三 总结

到这里执行计划就讲完了,sql的执行计划并不是很难,主要是记住每个列代表的意思和如何进行优化,这个是需要大量的训练和实操实现的, 有兴趣的小伙伴可以自行去试试,还是很有趣的,本文只是简单介绍一下MySQL执行计划,想全面深入了解MySQL,可优先阅读MySQL官方手册,大家加油~

 

责任编辑:姜华 来源: 牧小农
相关推荐

2022-02-15 07:36:21

SQLEXPLAIN数据库

2023-09-21 10:55:51

MysqlSQL语句

2021-05-28 10:46:36

MySQL执行计划

2022-11-02 15:28:55

MySQL执行计划B+树

2024-09-12 15:16:14

2022-08-08 08:03:44

MySQL数据库CBO

2011-09-14 17:03:17

数据库执行计划解析

2022-12-13 08:36:42

D-SMARTOracle数据库

2024-04-19 13:17:40

PostgreSQLSQL数据库

2020-09-15 08:44:57

MySQL慢日志SQL

2021-03-17 09:35:51

MySQL数据库explain

2015-04-22 14:17:45

SQL SERVERMSSQL SERVE缓冲区

2018-02-27 14:00:35

数据库MySQL统计信息

2017-11-15 08:50:59

数据库MySQL

2009-11-13 16:28:02

Oracle生成执行计

2022-08-15 15:09:26

SQL数据库MySQL

2021-09-07 10:43:25

EverDB分布式执行

2009-11-10 16:00:05

Oracle执行计划

2010-04-16 09:27:18

Ocacle执行计划

2021-02-20 08:40:19

HiveExplain底层
点赞
收藏

51CTO技术栈公众号