在 MySQL 中，聚簇索引和非聚簇索引，如何区分？-51CTO.COM

在 MySQL 的 InnoDB存储引擎中，聚簇索引和非聚簇索引是两种主要的索引类型。它们之间有什么相同点和区别？我们该如何理解他们呢？这篇文章我们一起来聊一聊。

聚簇索引（Clustered Index）是指表中的主键，它决定了表中数据的物理存储顺序。在 InnoDB 中，表的主键默认就是聚簇索引。如果没有显式定义主键，InnoDB 会选择一个唯一的非空索引作为聚簇索引；如果没有任何合适的索引，InnoDB 会隐式创建一个行ID作为聚簇索引。

聚簇索引使用 B+ 树结构存储数据。树的叶子节点直接存储完整的行数据。因此，聚簇索引既是索引又是数据存储的一部分。

聚簇索引的特点：

非聚簇索引（Non-Clustered Index）是指除聚簇索引之外的所有索引。在 InnoDB 中，非聚簇索引的叶子节点不存储完整的行数据，而是存储聚簇索引的主键值作为指向实际数据的引用。

非聚簇索引同样使用 B+ 树结构，但叶子节点只包含索引字段和对应的主键值。通过主键值，进一步查找聚簇索引以获取完整行数据。

非聚簇索引的特点：

聚簇索引和非聚簇索引的区别，可以归纳为下表：

方面	聚簇索引（Clustered Index）	非聚簇索引（Non-Clustered Index）
数据存储	数据按索引顺序物理存储在表中，叶子节点存储完整行数据	仅存储索引字段和对应的主键值，叶子节点不存储完整行数据
数量限制	每个表只能有一个聚簇索引	每个表可以有多个非聚簇索引
访问效率	对聚簇索引字段的查询效率高，范围查询性能优越	需要通过主键值回表查询数据，访问效率相对较低
维护成本	数据的插入、更新、删除可能导致数据页的重组，维护成本较高	需要维护额外的索引结构，插入、更新、删除操作时需要同时更新索引，成本较高
适用场景	适用于经常按主键或索引字段范围进行查询的场景	适用于需要多样化查询条件且非频繁范围查询的场景

在实际工作中，对于聚簇索引和非聚簇索引的使用，需要注意以下几点：

选择合适的主键：由于聚簇索引决定了数据的物理存储顺序，选择一个唯一且不频繁变动的主键非常重要。例如，自增主键（如 AUTO_INCREMENT）通常是一个不错的选择，因为它能够避免频繁的页分裂和数据重新排列。
优化二级索引：由于非聚簇索引依赖于聚簇索引（主键）来定位数据，选择合适的主键有助于提高非聚簇索引的查询性能。此外，尽量减少非聚簇索引的数量，以降低维护成本。
考虑数据插入模式：如果数据主要是按主键的顺序插入（如自增主键），可以减少数据页的分裂和碎片，提高插入性能。
复合索引的使用：对于需要根据多个列进行查询的场景，可以创建复合非聚簇索引（如 (col1, col2)），以覆盖更多的查询需求，提高查询效率。

本文，我们详细地分析了 MySQL InnoDB 表中的聚簇索引和非聚簇索引，了解了它们的特点和适用场景。

聚簇索引在 InnoDB 中是数据的物理存储顺序，默认情况下表的主键就是聚簇索引。它适合于需要按主键或范围查询的高效访问，但只能有一个，且维护成本较高。

非聚簇索引是辅助索引，存储索引字段和主键值，可以有多个，适合多样化的查询需求，但查询时需要额外的查找步骤，访问效率相对较低。

在日常工作中，理解和合理使用聚簇索引与非聚簇索引，可以显著提升 MySQL InnoDB 表的查询性能和整体数据库的运行效率。