浅谈在Oracle中如何利用REDO实现故障恢复　-51CTO.COM

在数据库中，Redo的功能主要通过3个组件来实现：Redo Log Buffer、LGWR后台进程和Redo Log File（在归档模式下，Redo Log File最终会写出为归档日志文件）。

在Oracle的SGA中，存在一块共享内存，称为Redo Log Buffer，如图1所示。

oracle重要概念REDO - kele_lipeng - kele_lipeng的博客

图1 Oracle Instance

Redo Log Buffer位于SGA之中，是一块循环使用的内存区域，其中保存数据库变更的相关信息。这些信息以重做条目（Redo Entries）形式存储（Redo Entries也经常被称为Redo Records）。Redo Entries包含重构、重做数据库变更的重要信息，这些变更包括INSERT、UPDATE、DELETE、CREATE、ALTER或者DROP等。在必要的时候Redo Entries被用于数据库恢复。

Redo Entries的内容被Oracle数据库进程从用户的内存空间复制到SGA中的Redo Log Buffer之中。Redo Entries在内存中占用连续的顺序空间，由于Redo Log Buffer是循环使用的，Oracle通过一个后台进程LGWR不断地把Redo Log Buffer的内容写出到Redo Log File中。

当用户在Buffer Cache中修改数据时，Oracle并不会立即将修改数据写出到数据文件上,因为那样做效率会很低，到目前为止，计算机系统中最繁忙的部分是磁盘的I/O操作，Oracle这样做的目的是为了减少IO的次数，当修改过的数据达到一定数量之后，可以进行高效地批量写出。

大部分传统数据库（当然包括Oracle）在处理数据修改时都遵循no-force-at-commit策略。也就是说，在提交时并不强制写。那么为了保证数据在数据库发生故障时（例如断电）可以恢复，Oracle引入了Redo机制，通过连续的、顺序的日志条目的写出将随机的、分散的数据块的写出推延。这个推延使得数据的写出可以获得批量效应的性能提升。

同Redo Log Buffer类似，Redo Log File也是循环使用的，Oracle允许使用最少两个日志组。缺省情况下，数据库创建时会建立3个日志组。

SQL> select group#,members,status from v$log;

GROUP# MEMBERS STATUS

---------- ---------- ----------------

1 1 INACTIVE

2 1 CURRENT

3 1 INACTIVE

当一个日志文件写满之后，会切换到另外一个日志文件，这个切换过程称为Log Switch。Log Switch会触发一个检查点，促使DBWR进程将写满的日志文件保护的变更数据写回到数据库。在检查点完成之前，日志文件是不能够被重用的。

由于Redo机制对于数据的保护，当数据库发生故障时，Oracle就可以通过Redo重演进行数据恢复。那么一个非常重要的问题是，恢复应该从何处开始呢？

如果读取的Redo过多，那么必然导致恢复的时间过长，在生产环境中，我们必需保证恢复时间要尽量得短。Oracle通过检查点（Checkpoint）来缩减恢复时间。回顾一下第1章中所提到的内容：检查点只是一个数据库事件，它存在的根本意义在于减少恢复时间。

当检查点发生时（此时的SCN被称为Checkpoint SCN）Oracle会通知DBWR进程，把修改过的数据，也就是此Checkpoint SCN之前的脏数据（Dirty Buffer）从Buffer Cache写入磁盘，在检查点完成后CKPT进程会相应地更新控制文件和数据文件头，记录检查点信息，标识变更。

在检查点完成之后，此检查点之前修改过的数据都已经写回磁盘，重做日志文件中的相应重做记录对于崩溃/实例恢复不再有用。如果此后数据库崩溃，那么恢复只需要从***一次完成的检查点开始恢复即可。如果数据库运行在归档模式（所有生产数据库，都建议运行在归档模式），日志文件在重用之前必须写出到归档日志文件，归档日志在介质恢复时可以用来恢复数据库故障

一、UNDO的使用说明

二、Undo段

在一个进程修改数据库过程中存放旧的数据，包括数据没有修改之前的位置和值。Undo段的头包含了一个事物处理表，表中存放了目前使用undo段事物处理的信息。一个系列的事物处理只使用一个undo段存放undo数据。多个并行事物处理可以同时写入一个undo段。

三、Undo段的作用

1、事务处理rollback

当一个事物处理修改了表中的一行，旧数据的映像就会存放在undo段中。如果事物处理rollback，Oracle Server就使用undo段中值再写回修改行。

2、事物处理恢复

当一个例程失败而还有一些事物处理没有完成，Oracle Server在数据库再次打开的时候就需要将所有没有提交的修改全部undo。这种rollback是事物处理恢复的一部分。由于undo段的修改也会被redo日志文件保护，因此恢复是能够进行的。

3、读取的一致性

当一个事物处理正在运行，其他的用户是不能看到任何这个事物处理没有提交的修改的。另外，在一个查询执行期间的数据改变是不应该显示在这个查询结果当中的。在undo段中的旧的数据（Undo数据）也为用户特定查询提供一个一致的映像。

四、读取的一致性

1、即使其他的事物处理修改了数据，Oracle Server也会保证一个查询看到的数据是一致的。当Oracle Server开始执行一个select查询，它将记录目前系统更改编号（SCN）并且确保这个SCN以后的任何数据修改将不会影响到这个查询结果。比如一个运行时间非常长的查询语句在执行过程中有发生了几个修改，如果一行数据在查询声明以前的修改没有提交，Oracle Server将从undo段中提取没有修改的以前的映像，并构建一个“读取一致”的行映像。

2、事物处理读取一致性

读取的一致性通常是指SQL查询语句。但是也可以通过在紧跟在事物处理声明后使用一下命令来使事物处理的读取也是一致的：

SET TRANSACTION READ ONLY;

或者可以在事物处理使用DML语句的时候在事物处理前面使用一下命令：

SET TRANSACTION ISOLATION LELVEL SERIALIZABLE;

使用上述两种方法都可以保证事物处理在数据读取时候的一致性，但是使用SERIALIZABLE参数将影响性能。

【编辑推荐】