假如供应商所提供的灾难恢复服务中包含了测试功能,那么请尽早理清该功能可以怎样支持到你的灾难恢复规划测试。尽量找那些可以提供***次数测试的公司,或至少在这方面有着相对宽松的策略,例如季度或每两个月一次的测试,以便于你的测试计划安排。
除此之外,看看供应商为开发基于云的灾难恢复计划和测试活动提供了哪些方面的支持。
在对于灾难恢复即服务(DRaaS)或基于云的灾难恢复(Cloud DR)测试过程中,以下20个***实践是你取得成功的保障。
- 明确你在基于云的灾难恢复计划中需要测试的内容,例如从生产系统到灾难恢复环境的故障迁移,以及从灾难恢复到正常生产的故障恢复。
- 书面记录下灾难恢复测试计划,明确谁需要参与测试,以及你所将需要的各种资源,例如虚拟化系统、数据库、数据以及网络服务。
- 系统和数据的负责人应当事先审查基于云的灾难恢复计划,从而确保计划目标符合预期。
- 在准备自己的产品之前,请先询问DRaaS供应商是否能提供测试脚本。
- 准备测试脚本以方便测试。这点相当重要,因为脚本在测试中同样需要验证,这将是你在日后实际情况中的操作程序,需要你的DRaaS供应商参与其中。
- 明确从DRaaS供应商处所能得到的支持水平;例如他们会到现场查看你的测试进度,或是用远程方式接入,以及所需其提供的技术支持。
- 确保测试所需的所有资源都能正常工作。
- 通知你企业组织中的其他部门——尤其是IT部门——有关灾难恢复计划的测试提案。同样不要忽略公司的管理层,告诉他们所讲测试的内容和预期的结果。
- 和测试团队的所有成员提前讨论灾难恢复计划测试中的相关活动,以便每个人都对在过程中的角色和职责了然于胸。
- 假如可以安排,并且DRaaS供应商提供支持,那么和尽可能多的参与者(包括供应商)安排预演。从中或许会发现潜在的问题,例如不正确的脚本,错误的URL或其它资源——这些都会对灾难恢复的顺利测试产生不利影响。
- 确保测试在不影响生产系统环境的正常运行,例如可以进行在研发和系统测试环境中。
- 一旦基于云的灾难恢复计划测试启动,需要有人时刻记录并控制测试活动的时间。测试脚本文档应当可以记录下特定活动完成的时间。
- 在测试中安排休息间隔来检查其进展状况;但是注意,在真正的紧急状况下你不会有这样的时间。假如活动未有按计划完成,请准停止测试。
- 一旦测试完成、结果记录在案,那么是时候进行总结汇报,看看哪些是有效,哪些并不奏效,以及对失败的活动如何进行补救。
- 记录测试的后续处理报告,提交管理层。
- 和DRaaS供应商一同回顾灾难恢复测试的结果,让他们知道该如何协助你解决问题。
- 如果可能的话再安排一次测试,从而判断修改后的测试计划和脚本是否顺利通过。如果不可能额外安排测试,那么考虑一下:测试中发现的问题假如在实际状况下发生,会给企业和组织带来怎样的风险。所有的调查结果都应在后续报告或测试报告中注明。
- 假如系统和资源会支持企业的关键业务,请执行附加测试,确保这部分资产会被快速恢复。
- 根据测试结果更新灾难恢复计划和其它相关文件。
- 和DRaaS供应商协调安排下一轮测试。
当拥有一位能够辨明轻重缓急的DRaaS供应商时,你基于云的灾难恢复计划会更有机会取得成功。