如何备份重要数据而不是垃圾数据

新闻
有很多方法可以区分哪些是需要备份的,哪些是不需要备份的,但基本的目标应该是始终备份在崩溃中生存所需的一切。

 有很多方法可以区分哪些是需要备份的,哪些是不需要备份的,但基本的目标应该是始终备份在崩溃中生存所需的一切。

[[333793]]

一些简单的事情,比如告诉备份产品要备份哪些文件和数据库,可能会对你的可恢复性产生巨大的影响。正确的备份选择在本质上是一种平衡,一方面要确保应该备份的所有内容都得到了真正的备份,另一方面又要尽量不备份没有价值的数据。

物理服务器包含

实际上,所有的备份产品都需要在物理服务器级别上进行一些初始的安装和配置。这意味着,要使本文中提到的任何策略有效,必须首先在数据中心的每个物理服务器上安装适当的软件。包括每个VMware或Hyper-V服务器(不要与这些服务器上的每个VM混淆),每个物理UNIX或Windows服务器,以及任何正在备份的云服务。在备份系统发挥它的作用之前,必须有人进行初始连接和身份验证。

选择性包含

在备份系统中包含文件、对象或数据库的最常见方法是在配置给定系统的备份时手动选择它们。这里有三个选择性包含的例子:

  • 点击vCenter或Hyper-V控制面板,手动选择要备份的虚拟机
  • 在所有数据库列表中手动选择一个或多个数据库
  • 手动选择一个或多个文件系统或子目录

这是很常见的方法,因为它符合人们的思维方式;他们想要执行备份,就指定要备份的内容。它还有助于很大限度地减少没有价值的备份数据量,因为很少有人会选择测试虚拟机或数据库,或者UNIX上像/tmp这样的文件系统。

选择性包含的问题是随着时间的推移会发生什么。如果只备份你手动选择的系统,那么当配置更改时又会发生什么?例如,当你向给定的VMware服务器添加新VM时,会发生什么情况?如果你把一个给定的虚拟机从VMware转移到Hyper-V,甚至是云上时,又会发生什么呢?如果你在VMware中手动选择它,它将不会在移动到另一个配置时自动开始备份。备份专家通常会对这种类型的备份选择方法提出警告,因为数据丢失的风险太高了。

自动包含

将给定的VM或数据库服务器添加到备份配置之后,另一种非常常见的方法是简单地指定应该备份在其中的所有VM、数据库或文件系统。这是最安全的备份包含方法,因为它可以确保每个新的数据源都将被备份。它解决了选择性包含的问题,因为VM(或从一种配置类型转移到另一种配置类型的VM时)将自动备份,而不需要通知任何人。

有人说这种方法实际上也确保了它将备份毫无价值的数据。虽然这是真的,但它也将确保你能够自动备份所有的重要数据。使用选择性包含的最坏情况是可能会有一个非常重要的文件系统、数据库或VM没有得到备份。而如果使用自动包含系统,最坏的情况将是你同时也在备份垃圾数据。

选择性排除

这种技术通常会与自动包含系统一起使用。客户配置他们的备份系统,以备份每个VM、数据库或文件系统,但是会排除列表中明确列出的那些。选择性排除也是一种两全其美的方法,因为它允许你使用自动包含来作为一种确保所有重要数据都能得到备份的方法,同时自动排除已知的无价值数据。

这可以在用户界面中完成,客户可以通过点击并手动选择他或她所知道的没有价值的驱动器或数据库。试图节省空间的管理员可能会将测试数据库或BM或/tmp之类的文件系统添加到排除列表当中,以确保不会在它们身上浪费空间。

设置选择性排除的另一种方法是使用通配符或正则表达式来标识不应该备份的内容。例如,可以指定*.tmp, *.cache,*.bak为通配符排除模式;任何带有这些扩展名的文件都将不会被备份。那些熟悉正则表达式的人将能够很有创造性地使用它们来排除特定类型的文件,无论它们是在哪里被找到。

基于标记的包含

在备份中包含数据的一种非常现代化的方法是使用标记,这在VM世界中非常普遍。这不仅能够允许你指定应该备份的具有特定标记的VM,还将允许你指定备份它们的方法。例如,可以指定使用#database标记的VM所应该使用的数据库备份策略进行备份,而该策略将以特定的方式处理这些VM。对于带有#fileserver、#test等标签的VM也是如此。你可以创建以特定方式运行的几种不同类型的备份策略,然后通过hashtag来将这些策略应用于不同的VM。

这是一种自动包含的形式,因为任何新的VM都将根据hashtag自动添加到适当的备份策略当中。你还可以继续使用自动排除系统来确保垃圾数据不会被备份。

默认包含

无论何时使用自动包含或基于标记的包含,都需要某种全包机制。例如,如果没有通过某种类型的hashtag或其他机制来自动选择VM或数据库,就需要确保它仍然会被备份。你使用的智能系统(如基于标记的包含)越多,默认的包含系统就会变得越重要。

如果你的备份系统支持它,它的工作方式应该是这样的:任何尚未由自动策略或基于标记的策略所选择的虚拟机或数据库都将由该策略备份。显然,该策略不会根据特定系统的需要进行调整,但至少会进行某种类型的备份。然后可以监视这个特定的策略,查看是否有任何系统使用默认包含系统进行了备份。如果是,也许你应该检查为什么会发生这种情况,并通过将它们放入适当类型的备份配置中来解决这个问题。

请记住备份系统设计的一个基本规则是:你不能恢复尚未备份的内容。没有人会因为备份了太多的数据而被解雇,但是很多人会因为没有备份足够的数据而被解雇。尽你所能消除浪费的备份,但要谨慎行事。与备份毫无价值的数据相比,你更需要关心没有被备份的数据。这应该有助于防止你创造很多人所说的生产恢复事件。

 

责任编辑:华轩 来源: 企业网D1Net
相关推荐

2021-11-12 11:59:26

业务数据备份备份存储

2023-11-29 14:52:38

2018-01-22 08:33:28

SparkHadoop计算

2024-10-29 14:34:46

2021-03-09 09:06:41

漏洞数据安全数据

2020-06-02 21:03:57

物联网产品物联网IOT

2010-10-26 11:14:07

Oracle数据库备份

2018-07-06 14:14:15

数据中心备份服务器

2020-08-26 10:23:24

物联网数据IOT

2011-03-25 10:47:17

Cacti备份数据

2020-09-01 07:00:00

数据备份数据库

2021-11-26 14:37:44

数据库业务逻辑应用程序

2023-06-16 11:54:59

数据分析项目

2022-11-14 11:55:39

数据分析项目

2022-05-09 19:59:15

RedisLRU 算法

2023-10-30 08:14:14

数据指标体系

2022-04-25 10:48:08

Commvault

2021-01-27 10:18:17

业务数据分析互联网

2019-02-13 16:35:05

数据运营

2020-10-09 08:09:25

大数据 人工智能 黑客
点赞
收藏

51CTO技术栈公众号