实现SQL Server 索引底层与操作中的注意事项

数据库 SQL Server
以下的文章主要讲述的是SQL Server 索引底层的实现,以及对相关索引在实际操作中一些值得我们大家留意的问题的描述。

本文主要介绍的是SQL Server 索引底层的实现,以及对索引结构的具体描述,非聚集索引的描述,以及对非聚集索引在实际操作中要注意的相关事项的具体描述,以下就是文章的相关问题的描述。

页和盘区(Page and Extents)

你的表(Tables)中数据实际上都存储在页(pages)里,除了BLOB类型的数据。如果某列的字段的类型为BLOB那么将有一个16字节的指针指向BLOB page。页是MS SQL Server中数据存储的最小单位。

每页包含以行(row)为单位保存数据。一行只能存储在一个页中。每页可以容纳8KB的信息。因为这个原因,每行的***值为8KB。一组相邻的8个页被称为一个盘区(Extent)

堆文件和分配映射索引(Heap and the Index Allocation Map(IAM))

堆文件在sysindexs表中只有一行记录,并且其indid = 0. sysindexs.FIRSTIAM字段指向了IAM页链表中一个IAM页,IAM页是用来管理SQL Server已经给堆文件分配的空间。MS SQL Server2000用IAM(Index Allocation Map)页来在堆文件中导航(navigate)。在堆文件中,数据页(data page)和数据页中数据没有按照特定的顺序存储,也没有链接在一起。数据页之间唯一的逻辑链接是通过IAM页中记录来实现的。

索引结构(Index Structure)

所有的SQL Server 索引都是 B-Trees。在这种树的顶端有一个根页(root page),通过root page来访问N个中级(intermediate level)页,直到树的底部、或叶级(leaf level)。可以通过树中每个节点的指针从上向下扫描整个索引树。另外,每个SQL Server 索引级(index leves)(可能是intermediate leve or leaf level)都有一个页链(page chain)。

在一个索引中有许多intermediate level。索引树的级数(树的高度)与索引码的宽度、索引类型、记录行数和表中的页数有关,并且索引树的级数是影响索引性能的一个重要参数。

非聚集索引(Nonclustered Indexs)

一个非聚集索引与一本书的索引相似。数据存储在一个地方,索引存储在另外一个地方,可以通过索引中的指针来访问存储的数据。索引中的条目是按照索引码的值按序存储,但是表中的信息可以按照不同的顺序存储(如可以按照聚集索引存储)。如果表中没有创建聚集索引,那么表中的记录就不能保证按照某种特定的顺序。

与你用一本书的索引方式一样,SQL Server2000也是先通过非聚集索引检索到查找数据在表的位置,然后通过该位置来检索数据。这使得非聚集索引非常适合精确匹配查询(This makes nonclustered indexes the optimal choice for exact match queries),因为索引条目中包含了你需要查找数据的位置信息。

如果当前的表是以聚集索引方式存储,那么非聚集索引的位置信息就是聚集索引的索引码(index key);否则,位置信息就是row ID(RID),每个RID由file number、page number和 slot number of row(每行记录的槽号)。比如,要在一个表中检索某个employee ID(emp_id),该表已经有在emp_id列上创建了非聚集SQL Server 索引,SQL Server查找索引树,找到一个索引条目包含你需要查找的emp_id,然后利用其中RID来访问到对应数据页中的值。

注意事项

非聚集索引适用于以下场景:

列中包含大量的不同值,如last name 和 first name 构成的复合索引(假如已用另外列创建的聚集索引) 。如果某列中只有很少的不同值,如0或者1,大多数查询不会利用该索引的,因为一个表扫描通常更有效率。

不返回大量结果集的查询 Queries that not return large result sets

经常被包含在一个查询条件语句(WHERE clause)的列,且该查询返回精确配备(return exact matches)

决策支持系统中经常需要表之间的关联(join)和聚集(group)。在被包含在join和grouping操作的列上建立非聚集索引,和在外键列上建立聚集索引。

一个给定的查询包含了表中所有的列,这样可以减少对表或聚集SQL Server 索引的访问。(Covering all columns from one table in a given query. This eliminates accessing the table or clustered index altogether.)我的理解就是覆盖索引。

聚集索引(Clustered Indexs)

一个聚集索引决定了一个表中数据的物理存储顺序。一个聚集索引与一个电话目录相似,电话目录是按照last name来存放。因为聚集索引决定一张表中数据的物理存放顺序,所以一张表只能有个聚集索引,一个聚集索引可以包含多个列(复合索引),就像电话目录一样按照last name 和 first name记录一样,聚集索引与Oracle中的IOT'S(Index-Organized Tables)相似。

一个聚集索引对范围查询非常有效率efficient on columns that are often searched for ranges of values。当用聚集索引把***个行检索出来之后,后续行一定能保证在物理上是相邻的。例如,应用的某个查询需要频繁执行一个范围查询,聚集索引可以快速定位到满足条件的***个数据,然后再检索表中与之相邻的记录直到***一条记录。

这样可以调高这类查询的性能。另外,如果某列经常用来对表中的数据进行排序(sort),该情况下也可利用聚集SQL Server 索引来节省每次排序的时间。

当索引值唯一时,需要查找一个指定行,此时聚集索引也是高效率的。例如,用最快的方式来找到一个指定empoyee ID的employee记录就是在emp_id列上创建一个聚集索引。

注意事项

在创建聚集索引时,SQL Server 索引列应该尽量少,这一点很重要。如果定义一个大的索引码,那么该表中的任何非聚集索引就会显著的增大,因为每个非聚集索引叶级索引条目都包含了一个聚集索引码。

聚集SQL Server 索引适用于以下场景:

列中包含大量的不同值

返回一个范围记录的查询,像BETWEEN, >, >=, <, and <=.的操作;

顺序访问的列

返回大量记录的查询

在查询中某列被频繁的包含在join或group语句中,尤其该列也是该表的外键。在ORDER BY或 GROUP BY语句的列上建立聚集索引可以减少SQL Server对数据的排序,因为表中行已经是有序的了,这样可提高查询的性能。

在OLTP类的应用中经常需要快速查找某行记录,尤其是一主键的来查找,此时可在主键上创建一个聚集索引。

聚集索引不适合以下场景:

频繁变化的列。这样造成了表中行经常移动,

宽键(wide keys)聚集索引的SQL Server 索引码被所有的非聚集索引来用来检索,所被存储在每个非聚集索引的叶级索引条目中。

【编辑推荐】

  1. 浅谈SQL Server临时表与SQL Server表变量
  2. SQL Server数据库的临时表的正确操作步骤
  3. SQL Server存储过程的命名标准如何进行?
  4. 卸载SQL Server 2005组件的正确顺序
  5. SQL Server浮点数据类型的详细解析
责任编辑:佚名 来源: 电子工业出版社
相关推荐

2010-07-19 14:37:20

SQL Server

2010-07-20 13:02:03

SQL Server索

2010-07-26 10:59:59

SQL Server游

2010-05-11 11:03:41

Mysql索引

2010-06-17 16:22:04

SQL Server

2013-02-26 14:07:52

SQL Server虚拟化

2010-07-01 16:45:15

SQL Server

2010-07-19 14:31:14

SQL Server

2010-07-15 13:38:35

2011-04-11 16:23:57

2011-05-03 16:58:55

喷墨打印机墨水

2010-10-26 17:28:15

创建Oracle索引

2011-08-02 13:08:06

Oracle索引

2010-06-29 17:32:13

SQL Server锁

2010-08-04 11:23:59

2021-06-30 06:19:14

编程语言无符号整数数据类型

2010-07-16 14:01:22

安装SQL Serve

2011-08-25 15:54:30

SQL Serverbit字段类型

2010-06-13 15:52:36

MySQL 复制设置

2009-10-30 10:05:48

双线接入
点赞
收藏

51CTO技术栈公众号