以下的文章主要向大家讲述的是SQL Server内存的管理,在默认的情况下,SQL Server 2000数据库其为了平衡运行在机器上得其他一些应用程序与数据库系统内部其他组建对内存的需要,实现对系统内存的动态分配和回收。
在早前的版本如7.0,你通过选项配置给SQL Server设定一个大小固定的内存;然而。除非你有具体的问题要求分配大小规定的内存,否则***是让SQL Server动态管理内存。
无论内存是以动态还是固定的方式进行分配,计算机系统为每个SQL Server实例分配的总的内存空间都可看做一个单个统一的缓冲区(unified cache),这些内存都以多种内存池(memory pool)的方式进行管理。每个内存池有各自的策略和用途,系统中的各个内部组件可以请求和授权使用池中的内存。
缓冲区管理和内存池(The Buffer Manager an Memory Pools)
SQL Server内存组件是缓冲池(buffer pool)。任何不被其他内存相关组件使用的内存都放在缓冲池中。缓冲池负责从硬盘上加载数据和索引页以供用户访问和共享数据。当其他组件申请内存时,它们向缓冲池发送一个缓冲请求。内存缓冲由若干个页组成,其中每页大小与数据或索引页大小相同(8K)。
缓冲区管理器(The buffer Manager)
SQL Server的进程(process)只能访问内存中的数据或索引页。不允许直接访问磁盘上的页。缓冲区管理器(The buffer Manager)是一个用来管理和控制物理磁盘中的页在内存中的进程。当某个进程需要访问数据或索引页时,该页必须首先在缓冲区存在。
如果访问的页在内存中不存在,则必须进行一次物理I/O访问来加载该页,这样进程就可以访问该页在内从中的拷贝了。因为物理I/O的访问是非常昂贵和耗时的,所以尽可能减少系统的物理I/O。一种解决方案就是给SQL Server提供更多内存。越多的页驻留在内存,当某个页被访问时就越有可能在内存中找到该页。
内存缓冲区的访问(Accessing Memory Buffers)
对SQL Server中进程来讲,一个数据库就像带有编号页的简单序列。数据库中的页可以用数据库编号、文件编号、页的编号来唯一标识。当一个进程访问一个页时,它向缓冲管理器发送一个请求,该请求指出要访问数据所在的数据库编号、文件编号、和页编号。
为了更快地访问内存中的数据和避免数据页的SQL Server内存扫描(memory scans),对缓冲池的页进行散列处理,以提供更快地访问。散列(Hashing)是一种同过一个散列函数把一个key映射到一个散列桶(hansh bucket)的技术。散列桶是一种内存中的数据结构,该数据结构包含一个指针数组(以链表方式实现),每个指针指向一个缓冲页(buffer page)。
A linked list chain of hash pages is built when the pointers to buffer pages do not fit on a single hash page. 散列桶的数量是SQL Server根据缓冲池大小动态进行调整。
在SQL Server中,散列值是由数据库编号、文件编号、页编号相结合生成的。散列函数生成散列值并保存在散列桶中。本质来讲,散列桶就是访问内存页的一个索引。即使在一个大的内存环境中,散列技术可以允许SQL Server快速查找内存中的具体数据页而这需要一些内存读操作。
利用散列算法也让SQL Server快速判断某个请求的页是否在内存中,而不需要一个内存缓冲区的扫描。
如果被请求的页在内存中,缓冲区管理者返回一个指向SQL Server内存缓冲区的指针,该内存缓冲区即为该进程请求的数据页。如果页不在内存中,则缓冲区管理者必须首先进行一次磁盘I/O操作把请求页读到内存缓冲区中,然后把指向该内存的指针返回给发送请求的进程。
如果请求页的进程最终对页中的任何信息进行了修改,该页就被标记为“脏页(dirty)”,当进行完成了对页的修改,缓冲区管理者会收到一个通知。缓冲区管理者协同日志和事务管理者,负责确保被修改的页写到了磁盘上。
【编辑推荐】