对于一个开发工程师来说,了解一下 MySQL 是如何执行一条查询语句的,不是一件坏事,阿粉带你来瞅瞅它是怎么执行的
一条看似非常简单的查询语句:
- select * from T where id=1;
然后 MySQL 就返回给了你结果,但是里面具体是如何执行的呢?
别急,听阿粉慢慢跟你说
首先咱们先来看一张图,接下来的过程都是基于这张图来讲的:
连接器
当客户端连接 MySQL 时,会发出连接请求到连接器,连接器此时就会去验证这个连接的账号密码
- 如果账号或者密码不正确,客户端就会收到一个 Access denied for user 的错误,之后此次连接结束
- 账号密码正确,连接器会到权限表里面查询出该账号所拥有的权限,之后这个连接里面的权限判断,都是以此时读到的权限为根据
所以你知道为什么更改了一个账号的权限之后,一定要断开再重连才有效吧~
在实际中肯定有这样的情况,就是一个连接建立之后,但是我没有执行什么操作,那么就可以说这个连接处于空闲状态( sleep )
如果长时间都没有什么操作的话,连接器就会选择把它断开,这个时间是由 wait_timeout 来控制的,默认值是 8 小时
连接都被断开了,如果此时客户端再次发送请求想要进行一些操作的话,那就需要重新建立连接才能往下走
在数据库中有两种连接:
- 短连接:每次执行完很少的几次查询就断开连接,下次想查询时,就要重新建立一个
- 长连接:如果客户端持续有请求,那就一直使用同一个连接
建立连接是比较麻烦的,首先要发送请求吧,发送了请求要去验证账号密码吧,验证完了要去看你所拥有的权限吧,所以在使用过程中,尽量使用长连接
但是使用长连接又有新的问题:有时候,你会发现 MySQL 占用内存,因为是长连接嘛,所以它会在断开的时候才将资源释放掉。
这个时候可以考虑下面两种方案:
- 定期断开长连接
- 如果使用的是 MySQL 5.7 或者更高版本,可以在每次执行一个比较大的操作之后,通过执行 mysql_reset_connection 来重新初始化连接资源,这个过程不需要重新连接和权限验证
分析器
连接器这一关是过来了,接下来就是去查询缓存
首先看缓存里面有没有,如果有呢,那就没有必要向下走,直接返回给客户端结果就可以了
如果缓存中没有的话,那就去分析器
但是聪明的你肯定发现了,我的小标题并不是缓存,而是分析器,为啥呢?
因为查询缓存的失效非常频繁,只要有对一个表的更新,那在这个表上的所有查询缓存都会被清空。所以就会导致 MySQL 费劲吧啦的把缓存给建立起来了,结果呢还没怎么用,一个更新操作,给弄没了
所以 MySQL 8.0 版本直接将查询缓存的整块功能都给删掉了,那么在这里也不细说,免得奇怪的知识增加
分析器首先会进行"词法分析",词法分析就是 select * from T where id=1; ,它会将 select 识别出来,哦,这是一个查询语句,接下来会将 T 也识别出来,哦,你是想要在这个表中做查询,然后将 where 后面的条件也识别出来,原来我需要去查找这些内容
OK ,“词法分析”之后,接下来是“语法分析”,语法分析主要就是分析输入的 SQL 语句合不合法
就比如英语里面的语法 “我用 is , 你用 are ”这种,如果不对肯定是不可以的,语法分析之后发现你的 SQL 语句不符合规则,就会收到 You hava an error in your SQL syntax 的错误提示
优化器
经过分析器分析之后, MySQL 就知道你要的是什么了
但是就像条条大路通罗马一样,看似是一条简单的 SQL 查询语句,有可能有好多条执行路径可以走,比如说要查询的表里面有多个索引,我使用哪儿个索引效率会比较高呀;多表联查的时候,我先关联哪儿个表效率会比较高呀
像这种就是优化器需要做的事情
执行器
优化器做完优化之后,就到了执行器
执行器就是要去执行语句了嘛,那我肯定要看看对于要查询的表 T 有没有查询权限,如果没有直接就拒绝,这没啥说的 如果有的话,那就会这样(在这里以 InnoDB 为例):
- 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 的值是不是 10 ,如果不是就跳过,如果是那就放在结果集中;
- 调用引擎接口取“下一行”;重复相同的判断逻辑,直到这个表的最后一行
- 执行器将上述遍历过程中所有满足条件的行,组成记录集返回给客户端
至此,语句执行结束
存储引擎
存储引擎,一听名字大概就能知道,它负责的是对数据的存储和提取
关于存储引擎这块,最熟悉的应该就是 InnoDB 了,毕竟从 MySQL 5.5.5 版本开始它就成为了默认的存储引擎
举个栗子
OK ,到这里你可能就比较了解了,但是阿粉这个暖男,为了让你更加的理解,还准备了个栗子,咱们来瞅瞅:
- select * from T where `name` = '阿粉' and age = '18' ;
还记得吗?MySQL 首先会怎么做?
- 通过连接器查询当前执行者的角色是否有权限,进行查询。如果有的话,就继续往下走,如果没有的话,抱歉,哪怕是你貌美如花,也要拒绝掉,同时甩你一个 Access denied for user 的错误信息
- 接下来就是分析器来分析语句了,嗯,你这个语句写的没啥问题,继续向下执行吧
- 此时来到了优化器,优化器就想,这条执行语句,有两种执行方案啊:
- 先查询表 T 中姓名为 阿粉 的,然后再判断他年龄是不是 18 岁
- 先查询表 T 中年龄为 18 岁的所有人,然后再从里面找到姓名为 阿粉 的
- 等优化器决定选择哪个方案之后,执行器就去执行了。然后返回给客户端结果