合成完全备份的工作原理及采用的原因

存储
合成完全备份技术是过去几十年来备份技术中最重要的进步之一,该技术基于硬盘备份、重复数据删除、连续数据保护(CDP)以及云计算技术发展起来的。

合成完全备份技术是过去几十年来备份技术中最重要的进步之一,该技术基于硬盘备份、重复数据删除、连续数据保护(CDP)以及云计算技术发展起来的。

以下了解合成完全备份技术的成因以及可能带来的好处。

[[326896]]

传统备份选项

备份技术本质上有两个非常广泛的类别:企业或者备份所有内容(完全备份),或者只备份已更改的内容(增量备份)。而增量备份也有不同的类型。企业的典型设置通常是每天晚上运行增量备份,而每周进行一次完整备份。有些企业并不经常这样设置。

定期完全备份的原因是执行还原时发生的情况。传统备份软件将恢复在完整备份上找到的所有数据,即使该磁带上的某些数据已被增量备份上可以找到的较新版本代替。然后,恢复过程将开始按照创建顺序从各种增量备份中恢复新文件或更新文件。

至少可以说,执行多个恢复的过程效率低下,其中一些恢复将被覆盖的数据。如果恢复来自磁带,则还必须添加插入和加载每个磁带所需的时间,在磁带上的适当位置查找,并在不再需要磁带时将其弹出。这一过程每盘磁带可能需要5分钟以上。

这意味着,使用这种类型的配置,完整备份的频率越高,恢复的速度就越快,因为它们浪费的时间更少。而从恢复的角度来看,每晚进行完整备份是理想的。这就是为什么在所有系统上每周执行一次完整备份非常普遍的原因。随着系统的自动化程度越来越高,一些从业者开始每月或每季度进行完整备份。

但是,在服务器或虚拟机上执行完全备份会在该服务器上产生大量负载。这就促使备份管理员尽可能减少完整备份的频率,即使这样做会导致恢复需要更长的时间。这种在备份和恢复效率之间的关系是合成备份出现的主要原因。

什么是合成完全备份?

合成完全备份是在恢复过程中充当完全备份的备份,但在备份过程中却不充当完全备份。实际上,在典型的合成完全备份配置中,完全备份几乎已经完成。实现这一目标的方法主要有三种。

创建合成完全备份的第一种方法(可能也是最常见的方法)是从可用备份创建一个完全备份。备份系统保存在每次备份期间找到的所有数据的目录。因此,在任何给定的时刻,它都知道所有的文件以及这些文件的哪个版本,如果要以传统方式创建一个完全的备份,那么这些文件将处于完全备份状态。它只是将这些文件从一个介质复制到另一个介质中。只要有多个设备可用,此方法就可用于磁带或磁盘。

这种执行合成完全备份的方法可能需要相当长的时间;但是,这一过程可以在一天中的任何时间运行,而不会对正在备份的系统造成任何影响。事实上,正在备份的服务器或虚拟机完全不相关。最终的备份在任何意义上都是完全备份,后续的增量备份可以基于这个完全备份。此方法唯一的缺点是复制完整备份所需的时间。

第二种方法只能在使用磁盘作为主备份目标时使用。只有当备份系统将每个更改的文件或块作为单独的对象存储在其存储系统中时,这也是可能的。这与备份系统传统上存储备份的方式形成了对比,其中许多文件放在一个容器中(例如tar或专有备份格式)。如果所有更改的文件或块都存储为单独的数据块,那么只需为构成完整备份的所有当前块的当前版本创建一个类似快照的视图,就可以创建一个合成完全备份。

这种方法有很多优点,首先它几乎不需要时间创建合成完全备份,因为没有数据移动。这意味着可以更频繁地创建合成完全备份,事实上,支持此功能的大多数系统在每次备份后都会执行这一操作。这意味着,虽然备份系统只执行增量备份,但其所有备份都表现为完全备份。这通常被称为块级永久增量备份系统,因为它再也不需要传统或使用上述复制方法来创建完整备份。

最后,有一种方法在某种程度上是这两种方法的混合。这只适用于目标重复数据删除系统。与上述第二种方法一样,所有备份都存储为小块数据,从而导致每个更改的文件或块都由存储在目标重复数据删除系统中的许多小块表示。这意味着该设备可以在很短的时间内创建虚拟完全备份(类似于上述的永久增量方法)。也可以通过备份产品来控制此过程,其中备份产品告诉目标重复数据消除系统创建合成完全备份。就像上面提到的第二种方法一样,这种方法非常有效并且几乎立即发生。

组织的系统是否支持合成完全备份?

无论是使用复制方法、块级增量备份,还是目标重复数据删除系统使用的虚拟复制方法,合成完全备份在大多数商业备份系统中已经非常普遍。如果组织不使用这一功能,则可能需要调查是否可以设置硬件和软件。如果不可能,这可能表明组织的备份系统将落后于时代。

 

责任编辑:赵宁宁 来源: 360机房
相关推荐

2011-12-07 14:25:33

JavaNIO

2012-04-18 16:42:03

PhoneGap

2018-06-29 23:21:27

物联网IoT网络

2009-06-04 10:41:52

Struts工作原理

2013-11-19 09:53:17

2020-09-11 19:38:31

GitOps仓库CI

2012-06-29 13:54:11

Java内存原型

2020-09-21 07:00:00

混合云

2013-12-05 13:46:51

2023-10-17 10:11:50

TCPIP

2020-07-10 09:04:55

HTTPS浏览器网络协议

2011-06-16 10:36:45

双绞线布线

2020-12-30 08:44:37

开源应用开发

2019-10-15 23:21:12

身份认证生物识别深度伪造

2017-04-26 15:40:07

云计算失败企业

2019-07-01 15:27:42

区块链矿业加密货币

2021-04-06 08:00:00

数据湖存储技术

2010-05-26 10:25:50

MySQLdump增量

2022-11-17 15:33:43

2022-05-11 22:10:05

分布式云云计算公共云
点赞
收藏

51CTO技术栈公众号