MySQL limit导致的执行计划差异

数据库 MySQL
今天收到一个业务的报警,提示慢日志比较频繁,登上环境查看,发现SQL是一条看起来很简单的语句,环境在MySQL 5.7.16版本下,慢日志里面执行时间显示是近1分钟,我在从库上面执行了一下,发现优化空间确实很大。

[[342082]]

今天收到一个业务的报警,提示慢日志比较频繁,登上环境查看,发现SQL是一条看起来很简单的语句,环境在MySQL 5.7.16版本下,慢日志里面执行时间显示是近1分钟,我在从库上面执行了一下,发现优化空间确实很大:

  1. select OrgId 
  2. from `testcomm`.apply_join_org 
  3. where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 1; 
  4. Empty set (48.71 sec) 

执行计划如下:

  1. explain select OrgId 
  2.     -> from `testcomm`.apply_join_org 
  3.     ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 1\G 
  4. *************************** 1. row *************************** 
  5.            id: 1 
  6.   select_type: SIMPLE 
  7.         table: apply_join_org 
  8.    partitions: NULL 
  9.          type: index 
  10. possible_keys: IndexRTUser 
  11.           key: IndexCreateTime 
  12.       key_len: 5 
  13.           ref: NULL 
  14.          rows: 4332 
  15.      filtered: 0.00 
  16.         Extra: Using where 
  17. 1 row in set, 1 warning (0.00 sec) 

到了这个时候,不上表结构有些草率了,结构有所删减。

  1. CREATE TABLE `apply_join_org` ( 
  2.   `ApplyJoinId` int(11) NOT NULL AUTO_INCREMENT, 
  3.   `RTId` int(11) DEFAULT NULL
  4.   `UserId` int(11) NOT NULL
  5.   `OrgId` int(11) NOT NULL
  6.   `ApplyMsg` varchar(100) DEFAULT NULL
  7.   `CreateTime` datetime NOT NULL
  8.   `ReplyMemId` int(11) DEFAULT '0'
  9.   `ReplyTime` datetime NOT NULL
  10.   `ApplyStatus` tinyint(4) DEFAULT '1' COMMENT '0拒绝1申请2同意'
  11.   `IfDel` tinyint(4) DEFAULT '1'
  12.   `UpdateTime` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
  13.   `RP` int(11) DEFAULT '0' COMMENT 'RP值'
  14.   `sex` tinyint(1) DEFAULT NULL
  15.   `IfLeaguer` tinyint(1) NOT NULL DEFAULT '0'
  16.   PRIMARY KEY (`ApplyJoinId`), 
  17.   KEY `IndexOrgIdStatus` (`OrgId`,`ApplyStatus`,`IfDel`), 
  18.   KEY `IndexRTUser` (`UserId`), 
  19.   KEY `IndexCreateTime` (`CreateTime`) USING BTREE 
  20. ) ENGINE=InnoDB AUTO_INCREMENT=22495957 DEFAULT CHARSET=utf8  
  21. 1 row in set (0.00 sec) 

此外涉及的这张表的数据量有2000万左右,从目前的执行效率来看,无疑于走了一个全表扫描。

其实这个问题到了这个还是比较好理解的。从语句的表现,结合表结构,我们可以感觉到: 整个SQL的执行过程中,原本是基于字段UserId,没想到却因为order by中的CreateTime,导致索引选择错误,执行代价差异很大。

所以到了这里,我们如何来定性这个问题:

1)是因为order by导致的吗?

2)是因为时间字段的排序导致的吗?

3)是因为limit操作导致的吗?

4)是因为userid本身的数据过滤效果差导致的吗?

对于这些疑问,我们可以很快通过几条对比SQL就能够快速验证。

通过如下的SQL可以看到order by不是最主要的原因

  1. select OrgId 
  2.     ->      from `testcomm`.apply_join_org 
  3.     ->       where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime ; 
  4. Empty set (0.01 sec 

order by排序也不是最主要的原因

  1. select OrgId 
  2.     -> from `testcomm`.apply_join_org 
  3.     ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc ; 
  4. Empty set (0.01 sec) 

order by排序+limit 10也不是最主要的原因

  1. select OrgId 
  2. from `testcomm`.apply_join_org 
  3. where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 10; 
  4. Empty set (0.01 sec) 

order by 排序+limit 2也不是最主要的原因

  1. select OrgId 
  2.     -> from `testcomm`.apply_join_org 
  3.     ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 2; 
  4. Empty set (0.01 sec) 

而经过这些对比,主要加入了limit 1,索引选择情况就会发生变化。我们抓取一条limit 2的执行计划来看看。可以明显看到type为ref,此外ref部分差异很大(const)。

  1. >explain select OrgId  from `testcomm`.apply_join_org   where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 2\G 
  2. *************************** 1. row *************************** 
  3.            id: 1 
  4.   select_type: SIMPLE 
  5.         table: apply_join_org 
  6.    partitions: NULL 
  7.          type: ref 
  8. possible_keys: IndexRTUser 
  9.           key: IndexRTUser 
  10.       key_len: 4 
  11.           ref: const 
  12.          rows: 4854 
  13.      filtered: 1.00 
  14.         Extra: Using index condition; Using where; Using filesort 
  15. 1 row in set, 1 warning (0.00 sec) 

如果想得到更进一步的信息,可以使用如下的方式:

  1. SET optimizer_trace="enabled=on" 
  2. SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE\G 

查看

reconsidering_access_paths_for_index_ordering部分的信息会是关键所在。

"index_provides_order": true,

"order_direction": "desc",

而对于这个问题的分析,主要还是在于对于cost的评估方式,显然在目前的测试中,增加了额外的order by排序操作,导致了代价会略微高一些,而在优化器中在评估中,显然这部分是缺失了一些信息导致判断失误。

有如下几种方式可以修复:

1)补充完整的复合索引,userid和CreateTime能够做到互补,该方案已经在同构环境中做了完整的模拟测试,能够达到预期

  1. alter table  `testcomm`.apply_join_org drop key IndexRTUser; 
  2. alter table  `testcomm`.apply_join_org add  key `IndexRTUser2`(UserId,CreateTime); 

2)使用force index的hint方式来强制索引,当然对于业务具有一定的侵入性

3)调整SQL逻辑模式,确实是否可以使用其他的方式来代替这种limit 1的使用模式。

 

而从长计议,其实整个评估中的优化器还是比较薄弱的,对于索引选择中的判断依据,如果有了直方图等辅助信息,整个过程会更加如虎添翼,这块的内容,准备在8.0中进行一些模拟测试,稍后奉上测试结果。

本文转载自微信公众号「 杨建荣的学习笔记」,可以通过以下二维码关注。转载本文请联系 杨建荣的学习笔记公众号。

 

责任编辑:武晓燕 来源: 杨建荣的学习笔记
相关推荐

2023-09-21 10:55:51

MysqlSQL语句

2021-05-28 10:46:36

MySQL执行计划

2022-08-08 08:03:44

MySQL数据库CBO

2011-09-14 17:03:17

数据库执行计划解析

2024-09-12 15:16:14

2022-02-15 07:36:21

SQLEXPLAIN数据库

2021-04-24 12:01:08

MySQL数据库Mysql执行计划

2021-03-17 09:35:51

MySQL数据库explain

2015-04-22 14:17:45

SQL SERVERMSSQL SERVE缓冲区

2010-04-16 09:27:18

Ocacle执行计划

2018-02-27 14:00:35

数据库MySQL统计信息

2017-11-15 08:50:59

数据库MySQL

2009-11-10 16:00:05

Oracle执行计划

2022-08-15 15:09:26

SQL数据库MySQL

2009-11-13 16:28:02

Oracle生成执行计

2021-02-20 08:40:19

HiveExplain底层

2009-11-18 17:05:47

捕获Oracle SQ

2021-09-07 10:43:25

EverDB分布式执行

2011-08-18 14:10:51

Oracle不走索引

2022-12-13 08:36:42

D-SMARTOracle数据库
点赞
收藏

51CTO技术栈公众号