唯一确定灾难恢复计划是否有效的方法是灾难来临时对其进行测试。而企业需要确保其计划不会因频繁测试而变得乏味。
由于过于强调制定灾难恢复计划,因此企业经常忘记其目的,他们甚至希望评估最详细的计划以确保一切正常。而没有采用灾难恢复测试策略,就无法保证最终计划,所以做些什么都是值得的。
这是一个通俗的故事:企业需要了解在灾难发生时(不同类型、范围和程度的影响发生变化)应采取什么样的措施。通常,企业会花费大量精力开展业务影响分析和风险评估,然后制定计划。
未经测试的计划几乎是一系列概念性步骤。诚然,有些事情是可行的,但是随着环境的变化和业务需求的发展,并不能保证未经测试的计划是可行的。
因此,企业需要测试灾难恢复计划,必须证明自己的能力,并证明自己的计划是否会奏效。灾难恢复计划的重点是主动减轻与灾难相关的风险,而测试该计划可以减轻计划无法工作的风险。
以下有四个步骤可为企业指明建立正确的灾难恢复测试策略的路径:
1.确定计划的哪些部分需要测试
企业的灾难恢复测试可以包括从单个系统到多个应用程序到整个环境的任何内容。根据对企业至关重要的内容,需要首先定义需要测试的内容。一定要在思维中包含依赖性,例如如果Exchange依赖于Active Directory和DNS记录,需要注意这一点。
在灾难恢复测试策略中,测试频率应基于计划更改的频率。
2.确定测试频率
人们一直有一个问题,采取的灾难恢复计划应该多久测试一次。在灾难恢复测试策略中,测试频率应基于计划更改的频率。完全不变的工作负载可能只需要每年进行一次灾难恢复测试。当系统、应用程序和平台发生变化时,灾难恢复计划会得到更新,这意味着需要对其进行测试。这个决定不一定是最终的。可以每季度或每半年审查一次对灾难恢复计划进行测试的必要性,这取决于相关工作负载的重要性。
3.选择测试方法
企业有四种普遍接受的方法来执行测试。当考虑哪一个适合自己的时候,需要记住其目标始终是验证该计划将在实际执行中切实有效。四种常见的方法是:
(1)简单的计划审核——这听起来是很基本的措施。灾难恢复团队仔细检查计划,确定所有过时和丢失的部分。
(2)浏览计划——灾难恢复团队像执行计划一样仔细浏览计划,讨论步骤并确定任何潜在问题。通常,这是通过使用恢复方案来完成的,以确保该计划适用于特定的灾难情况。
(3)灾难恢复场景模拟——这基本上是将灾难恢复计划实际执行到非生产灾难恢复环境中。它通常限于特定的工作负载、系统、应用程序等,并且不包括整个环境。
(4)完整的灾难恢复模拟——与以前的方法相同,但是企业需要尝试在操作和位置完全丢失的情况下恢复所有内容。
4.更新企业的灾难恢复计划
企业的测试应发现该计划已经就位无需调整,或者更有可能存在需要解决或更新的缺陷、错误和遗漏。因此,假设企业需要在测试后添加一些时间来更新灾难恢复计划,以便它反映确保成功恢复所需的任何更改。
灾难恢复测试可能是灾难恢复计划中最重要的部分。没有进行测试,企业真的不知道该计划是否会生效。因此,如果企业的计划中目前没有灾难恢复测试策略,那么添加一个策略将会非常有益。这样的话,企业就很清楚在真正恢复的时候会发生什么。