如果备份或者恢复一个DB2数据库需要花费几个小时时间,那么及时这个备份与恢复方案再安全,也于事无补。或者说,是一个不合适的解决方案。为此在考虑备份恢复方案本身安全性的同时,也需要兼顾备份与恢复的效率。在这篇文章中,笔者就介绍一下提高数据备份与恢复效率的一些常用技巧。经过笔者多个案例的实际应用,证明这些技巧在提高DB2数据库备份与恢复的性能具有很大的帮助。
一、了解数据的逻辑存储结构。
如果以前有Oracle数据库经验的管理员,那么了解DB2数据库的逻辑存储结构就比较容易了,因为两者在这方面很类似。对于DB2数据库来说,其逻辑存储结构主要分为数据表、表空间与数据库三个级别。数据表包含在表空间之中,而表空间又包含在数据库当中。换一句话说,一个DB2数据库包含多个表空间,而每个表空间又包含了多个数据表。一个数据表示不能够保存在多个表空间当中的。同理,一个表空间也不能够保存在多个数据库之中。这跟小学的实施,班级里分组类似。一个班(相当于一个数据库)分为四个小组(每个小组相当于一个表空间),然后每个小组又是由一个个的学生组成的(一个个学生相当于一个个数据表)。这个组织结构可以有什么好处呢?此时学校校长(相当于数据库管理员)就可以按照班级、小组为单位对数据进行管理,也可以对学生进行一对一的面谈,从而提高数据库管理的灵活性。
而对于数据备份与恢复作业来说,采用如此的逻辑结构,数据库管理员既可以对整个数据库进行备份与恢复(对整个班级进行管理);也可以以表空间为单位,对表空间中的所有数据表进行备份与恢复操作(以小组为单位进行管理);甚至可以对单独的数据表进行备份与恢复的操作(对单个学生进行管理)。即可以分别从数据表、表空间、数据库三个级别来进行备份与恢复的操作。这分级别的管理,不仅增强了操作的灵活性,而且还可以提高备份与操作的效率。如现在用户需要对某个表进行更新,如需要调整价格表中的价格。此时数据库管理员就只需要对价格表进行更新即可,而不需要对整个数据库进行备份。显然这可以减少备份的时间。若出现问题的话,也只需要对这张表中的内容进行恢复。这也可以在很大程度上减少恢复的时间。恢复一张表肯定比恢复整个数据库所用的时间要少的多。
二、合理规划表空间提高数据库备份恢复性能。
既然数据库备份与恢复可以按三个级别来进行,那么数据库管理员可以根据这个特性来合理规划表空间,以提高数据库备份与恢复的性能。如在DB2数据库中,虽然对于LOB等大容量数据类型提供了很好的支持。但是,毕竟其容量比较大,有时候其所占的数据库容量可能达到整个数据库的二分之一。为此这些大容量的数据类型就成为了数据库备份与恢复作业作业的性能瓶颈。如果在数据库备份与恢复的时候,不备份这些LOB数据类型的数据,那么数据库备份与恢复的时间可能会减少三分之一,甚至二分之一。
为此笔者建议,在规划数据表的时候,***将LOB数据类型的数据与其他数据分成两张表来存放。如在一个产品信息表的表中,包含一个产品图片的字段,这个字段就是一个LOB数据类型。虽然可以将它们设计在同一个表中。不过笔者还是建议将他们分为两个表来存放,然后通过关键字将他们连接起来。***将这个两张表分别存放到不同的表空间中。如将有LOB数据类型的表统一保存在LOB表空间中。如此有什么好处呢?当数据库进行备份时,平时可以只对非LOB表空间中的数据进行备份。由于LOB表空间中的一些信息一般不怎么会更新,就可以一个星期更新一次。或者让其在数据库比较空闲的时间进行备份。经过一段时间的测试,可以发现每天或者每周数据库的空闲时断。如此规划的话,就可以将平时备份的效率提高。同理,在恢复的时候也可以按照表空间级别来进行恢复,从而缩短数据库恢复的时间。
这个方案的核心就是将LOB等大容量数据类型的数据与普通表独立开来,并且存放在不同的表空间中。然后将LOB表空间与非LOB表空间进行分开管理,分开备份与恢复,从而提高数据库备份与恢复的效率。为此在建立表时将LOB数据类型与其他数据类型分开存放是关键。
三、对于图片等LOB数据类型的另类处理方式。
当数据库中LOB数据类型比较多的时候,往往会在很大程度上影响数据库的性能。不仅数据备份与恢复会受到影响,连平时的查询也会受到牵连。为此笔者有时候给企业部署DB2数据库系统的时候,往往会建议他们,不要将图片等信息存放在数据库中。那么当用户需要查询图片信息时,该如何处理呢?笔者建议他们将图片统一放到网络上的一个共享服务器中。然后在数据库中只存放这个图片的路径。***在客户端界面设计时,可以创建一个指向图片的链接。当用户需要访问某个产品的图片信息时,则只需要点击产品管理界面上的图片链接,就可以打开这张图片。在这种情况下,数据库实际存储的只是图片的路径(也就是一个普通的字符型字段),而不是图片本身。故可以提高客户端窗口显示的速度,同时也可以提高数据库备份与恢复的效率。
四、为系统设置合适的并行度与缓存来提高数据库备份与恢复性能。
数据库备份与恢复的性能除了跟数据类型有关之外,还跟系统的并行度与缓冲区有关。通常情况下,如果硬件设备支持的话,增加并行度与增加缓冲区的大小可以提高数据库备份与恢复的性能。为此在对DB2数据库进行备份的时候,可以通过给并行度、缓冲区树木和缓冲区大小分配合适的值来提高数据库备份与恢复的性能。如一般情况下,笔者建议将数据库缓冲区的大小设置为数据内存的二倍到三倍。如果备份中包含大容量的数据类型,可以适当提高整个比例。并且将数据库缓冲区的数目设置为硬盘I/O缓冲数目的两倍。如此设置之后,数据库的备份与恢复性能能够得到很大的改善。
不过需要注意的是,这个调整会受到服务器硬件资源的限制。当服务器内存等硬件设备不支持这么大的数据缓冲区与数据缓冲区数目时,反而会因为没有足够的内存分配给缓冲区,从而导致数据备份与恢复的失败。为此笔者建议,在调整数据缓冲区的时候,需要特别注意。一般来说,调整好这些参数之后,需要持续追踪一段时间,以确保这些调整不会影响到数据库的正常备份与恢复,不会与数据库的硬件配置相冲突。