我们也许有过这样的经历:用 mysql 客户端连上数据库,执行一条 SQL,结果迟迟执行不完,我们等得不耐烦了,顺手就是一个 Ctrl + C。
Ctrl + C 之后,客户端会干什么,服务端又会发生什么?我们一起来看看。
本文内容基于 MySQL 8.0.32 源码,涉及存储引擎为 InnoDB。
1、客户端会干什么?
想要观察 Ctrl + C 时,客户端会干什么,用 mysql 连接数据库时可以指定 -v 参数,如下:
连上数据库之后,执行一条 SQL(以 UPDATE 为例)。SQL 执行完成之前,在键盘上按下 Ctrl + C,如下:
注意:没有使用 begin 显式开启事务,且系统变量 autocommit 的值为 ON。
从以上输出可以看到,客户端 Ctrl + C,实际上是给服务端发出了一条 KILL QUERY 命令。
这和我们手动执行 KILL QUERY 命令是一样的,接下来,我们就来看看服务端是怎么执行 KILL QUERY 命令的。
2、KILL QUERY
在 KILL QUERY 命令之前,客户端已经发出了一条 Update SQL,服务端分配了一个线程,正在执行 Update SQL。
Update SQL 还没执行完,客户端 Ctrl + C 又发出了 KILL QUERY 命令,服务端收到命令之后,会调度另一个线程来执行 KILL QUERY 命令。
为了方便介绍,我们把执行 Update SQL 的线程称为 Update 线程,执行 KILL QUERY 命令的线程称为 Kill 线程。注意:MySQL 内部是不做这样区分的。
KILL QUERY 命令的执行流程如下:
第 1 步,Kill 线程根据 query id 查找 Update 线程。如果没有找到,KILL QUERY 命令执行结束;如果找到了,进入第 2 步。
query id 是 show processlist 执行结果中的 id 字段。
第 2 步,Kill 线程判断当前连接的 MySQL 用户是否有权限干掉 Update 线程。如果没有权限,KILL QUERY 命令执行结束;如果有权限,进入第 3 步。
第 3 步,判断 Update 线程是否正在读写数据字典表。
如果不是,Kill 线程继续执行第 4 ~ 6 步;如果是,Kill 线程的使命就到此结束了,接力棒交给 Update 线程。
Update 线程读写数据字典表结束,就会马上开始执行 KILL QUERY 命令的第 3 ~ 6 步。
这种情况下,第 3 步会被执行 2 次(Kill 线程和 Update 线程各执行一次)。
第 4 步,把 Update 线程的 killed 属性设置为 KILL_QUERY,此时,Update 线程处于被标记为将要被干掉,但是还没有被干掉的状态。
这一步可以想象成城市建设过程中,在要拆迁的房子上写了个大大的拆字,但是房子还立在那里。
第 5 步,如果 Update 线程正在等待获取存储引擎中的锁,则放弃等待;如果 Update 线程已经持有存储引擎中的锁,则释放锁。
第 6 步,判断 Update 线程是否持有某个条件变量(保存在 current_cond)中。
如果持有,发送广播通知正在等待这个条件变量的其它线程,告诉它们可以继续执行了。
通过前面的介绍,我们可以看到:不管是 Kill 线程,还是 Update 线程自己执行第 3 ~ 6 步,都只是给 Update 线程打上了 KILL_QUERY 标记,而没有直接把 Update 线程干掉。
Update 线程是怎么被干掉的呢?请继续往下看。
3、自己把自己干掉
KILL QUERY 执行过程中,为什么不直接把 Update 线程干掉?
不是不想,而是不能。
因为线程不管执行什么操作,都需要进行收尾工作,做到有始有终。
如果 Update 线程直接被干掉,就来不及进行收尾工作,例如:已经申请的内存无法释放,会导致内存泄漏。
所以,想要妥善干掉一个线程,需要即将被干掉的线程主动配合 Kill 线程才行。
妥善干掉一个 Update 线程的场景是这样的:
Kill 线程对 Update 线程说:我要把你干掉。
Update 线程回答:不劳你动手,我自己来。
MySQL 让这个场景变成现实的方式,是在代码中的各个角落进行埋点,埋点逻辑:判断当前线程是否被打上了 KILL_QUERY 标记,如果是,则中断正在执行的操作,进入收尾阶段。
举个例子:
从以上代码可以看到,执行 Update 操作过程中,如果发现读取出错(对应本文场景是 Update 线程被打上了 KILL_QUERY 标记),直接 break 退出循环,中断执行。
4、回滚
Update 线程执行过程中,事务有可能已经增、删、改了一些数据,中断正在执行的操作之后,事务是需要回滚的。
当 Update 线程的执行流程回到 mysql_execute_command():
从代码中可以看到,thd->is_error() 返回 true,说明事务执行过程中出现了错误,对应到本文的场景,就是事务被 KILL QUERY 中断了,会执行 trans_rollback_stmt(thd),回滚事务。
只有在开启组复制(GROUP REPLICATION)过程中出现错误时,early_error_on_rep_command 才有可能被设置为 true,这里我们先忽略。
到这里,KILL QUERY 就算是基本介绍完了。
之所以说基本介绍完了,是因为还留有一点点尾巴。
前面我们介绍过,Update 线程执行到埋点的时候,如果判断自己已经被标记为即将被干掉,就会中断执行。
但是,还有一种很小的可能性,就是 Update 线程执行过程中,已经经过了所有埋点之后,才被标记为即将被干掉,Update 线程也就没有机会中断执行了。
这种情况下,就会进入以上代码中的 else 分支,执行 trans_commit_stmt(thd),提交事务。
鉴于进入 else 分支提交事务的可能性很小,我们可以认为只要客户端 Ctrl + C,Update 线程就会中断执行,并回滚事务。
5、总结
客户端连接上 MySQL 之后,给服务端发送一条 SQL,SQL 执行完成之前,客户端 Ctrl + C,实际上会给服务端发送一条 KILL QUERY 命令,和我们手动执行 kill query <query_id> 的效果是一样的。
服务端会分配一个空闲线程(Kill 线程)执行 kill query 操作,给 Update 线程打上 KILL_QUERY 标记。
如果即将被干掉的线程(Update 线程)正在读写数据字典表,它会从 kill 线程手上接过接力棒,给自己打上 KILL_QUERY 标记。
Update 线程发现自己被打上了 KILL_QUERY 标记,就会中断执行,在 mysql_execute_command() 方法中,会回滚事务。
有一点需要说明,前面只是以 Update SQL 为例来介绍 KILL QUERY,其它 SQL 的 KILL QUERY 流程也是一样的。
6、番外篇
前面 1 ~ 5 小节介绍的是没有通过 begin 语句显式开启事务,并且系统变量 autocommit 的值是 ON 的场景。
如果通过 begin 显式开启了事务,或者把系统变量 autocommit 的值设置为 OFF,前面 1 ~ 5 小节介绍的内容也是适用的,但是会有一点区别:
4.回滚小节只能作用于事务中的一条 SQL,而不会影响整个事务。至于整个事务是提交还是回滚,取决于我们会给服务端发送 commit 还是 rollback 语句。
本文转载自微信公众号「一树一溪」,可以通过以下二维码关注。转载本文请联系一树一溪公众号。