好的索引当然是要覆盖了!

数据库 其他数据库
覆盖索引不需要回表,直接在 B+Tree 这颗索引树上就能读取到需要的数据,这极大的减少了数据库 IO 次数,在 IO 密集型应用中,这样的性能提升非常有效。

如果你的查询中用到了索引,这是一个进步,如果能够更进一步,用到了覆盖索引,那么就更牛了!当我们设计一个索引的时候,如果能够从一个更加全面的角度去设计这个索引,不仅考虑到 where 中的条件,还能够考虑到整个 SQL,那么无疑这个索引的设计将是非常成功的。

当然不能为了覆盖而覆盖。

1. 什么是覆盖索引

要理解什么是覆盖索引,我们需要先来回顾一下 InnoDB 中索引树的数据结构。

假设我有如下数据:

id(主键)

username

age

address

gender

1

ab

99

深圳


2

bw

95

天津


3

cx

93

深圳


4

bc

80

上海


5

bg

85

重庆


6

ac

98

广州


7

bw

99

海口


8

ck

90

深圳


9

cc

92

武汉


10

af

88

北京


现在我给 username、age 以及 address 三个字段建立一个联合索引,那么这个联合索引的 B+Tree 可能是这个样子:

图片

上面这个索引树是一个非聚集索引或者也可以说是一个二级索引,这种索引区别于我们之前文章跟大家聊的聚集索引(再聊 MySQL 聚簇索引),在聚集索引中,叶子结点就是这一行的数据,但是在二级索引中,叶子结点中保存的是主键值。

所以,当我们搜索的时候,如果使用的是二级索引,那么最终拿到的是主键值,有了主键值之后,我们还需要再去到聚簇索引中进行搜索,才能拿到完整的数据,这个过程我们也称之为回表。

很明显,如果进行了回表操作的话,那么执行效率显然就要下降一截,那么是否用到了二级索引就会回表呢?其实不然!如果是覆盖索引的话,就不需要回表。

那么什么是覆盖索引呢?

小伙伴们观察上面的索引树,大家发现在这个索引树中,离叶子结点最近的树枝上有 username、age 以及 address,而叶子结点上有 id,所以如果我想要查询的字段是 id、username、age 以及 address 中的任意一个或者任意几个的话,那么就不需要再去聚簇索引上查询了,当前这个 B+Tree 上直接就有现成的,直接返回即可,这个就是覆盖索引。

2. 实践

现在假设我有如下一张表:

CREATE TABLE `user` (
  `id` int unsigned NOT NULL AUTO_INCREMENT,
  `username` varchar(255) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
  `age` int DEFAULT NULL,
  `address` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci DEFAULT NULL,
  `gender` varchar(2) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `user_prop_index` (`username`,`age`,`address`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

可以看到,这张表中有一个名为 user_prop_index 的索引,这个索引中一共存在三个字段,分别是 username、age 以及 address,现在我们来看如下 SQL 的执行计划:

explain select address from user where username='ab' and age=99\G

图片

小伙伴们看到,Extra: Using index 就表示使用到了覆盖索引,因为我的查询 SQL 中最终想要的值,都在当前这棵索引树上。

更进一步,假设我要查询 id、address 以及 age 字段,如下:

explain select id,address,age from user where username='ab'\G

图片

很明显,由于这三个字段都在索引树上,所以直接直接通过回表获取到。

但是,如果想直接 select *,那么由于这个索引树上没有 gender 字段,此时就必须要回表才能拿到 gender 字段的值,如下:

explain select * from user where username='ab'\G

图片

可以看到,这个时候没有用到覆盖索引了。

3. 覆盖索引的优势

通过前面的介绍,覆盖索引的优势相信小伙伴们也能自己总结出来:

  1. 覆盖索引不需要回表,直接在 B+Tree 这颗索引树上就能读取到需要的数据,这极大的减少了数据库 IO 次数,在 IO 密集型应用中,这样的性能提升非常有效。
  2. 基于 B+Tree 中联合索引数据的排序规则,覆盖索引中,如果涉及到范围搜索,也是非常高效的(如果涉及到回表的话,效率就会降低很多)。
责任编辑:武晓燕 来源: 江南一点雨
相关推荐

2009-12-22 15:38:56

Linux安全性

2022-08-28 20:15:47

SD-WAN虚拟化的网络网络

2018-01-02 16:29:49

MySQL存储分析

2017-10-16 00:57:23

单元测试代码覆盖

2020-06-23 11:30:38

Nginx高并发性能

2022-03-08 14:10:10

数据分析数据集Python

2020-02-14 18:10:40

MySQL索引数据库

2017-09-05 12:44:15

MySQLSQL优化覆盖索引

2010-04-15 11:27:03

无线中继覆盖

2011-09-30 09:51:04

VXLANLAN虚拟网

2010-07-07 11:28:12

SQL Server索

2020-11-27 06:58:24

索引

2021-05-19 15:15:52

戴尔科技

2023-09-22 10:05:32

2015-11-10 09:09:23

代码程序员成长

2013-12-20 09:55:11

飞鱼星无线云飞鱼星路由器飞鱼星

2021-02-03 08:52:52

Mysql索引数据库

2010-08-27 10:25:26

2015-01-23 13:28:11

OfficeWindows Pho
点赞
收藏

51CTO技术栈公众号