有不少人对传统离线的灾难恢复和云计算中的灾难恢复这两个概念还存在着混淆。弄清楚其中的差异与恢复需求是维持一个固定灾难恢复策略的第一步。
无论是否是在云计算中实施灾难恢复,一个成功灾难恢复计划所包含的要素都是相同的:
1.用于灾难的计划
2.记录你的计划
3.测试你的备份文件
4.修正任何存在的问题
5.再次测试,以确保你已解决了所有的问题
6.经常性地重复上述步骤
最后一步的“重复”是让灾难免于发生的关键所在。
灾难恢复技术已从基于磁带的恢复技术和租用数据中心空间对重要服务进行恢复发展至即时地从发生故障的站点切换到虚拟的失效备援站点。在云计算灾难恢复供应商如何管理离线组件,或他们如何对一个IT环境实现云计算化方面是存在着差异的。有些人可能会说,他们相信灾难恢复可通过云计算实现,而有些人则不这么认为。
大多数厂商将设备插入到客户的IT基础设施,以获取信息并将其存储在本地,然后复制到云中。在绝大多数情况下,事实上数据并不会存在于云中;实际上数据被转移至供应商的数据中心中。这一方法类似于传统的备份解决方案。这一方法的本地化和高速可允许你从发生非灾难性数据丢失事件的设备中恢复数据。在将被保护站点离线的实际灾难事件中,离线数据通过互联网重新上线。
一旦你了解到灾难事件中数据的位置,确定满足公司需求的恢复点对象(RPO)和恢复时间对象(RTO)成为了IT团队和业务经理的首要任务。虽然可能有许多公司都要求“永远在线、永不掉线”的运行,但是实际的预算和灾难发生概率都在时刻提醒他们,他们的这一需求是完全不必要的。最重要的是要制定出切实可行的灾难恢复目标。
对于那些依赖于技术创造价值的公司来说,一个零RPO/零RTO的准则同样有效;为这个灾难恢复计划支付费用是组成这一业务成本的一部分。而对于其他的公司,计算机网络保险和高RPO/RTO就足够了。业务规模越大,其组合复杂程度越高,同样RPO和RTO需求的复杂程度也越高(从0/0到8小时/24小时设置,甚至于更为复杂24/24的需求。)
云计算选项中的灾难恢复
虚拟化是基于云计算灾难恢复技术的基础。在这个过程之后,就成为了一个真正的云计算服务。诸如IBM公司、Iron Mountain公司、CommVault公司、Simply Continuous公司和AppAssure公司等主要供应商提供了基于云计算的商业级灾难恢复产品,该产品旨在整合业务标准和流程、报告活动并可使IT团队和业务单位了解产品状态。
已创建用于恢复IT环境的虚拟机(VM)与你使用物理机器在专用设施中使用的虚拟机并无不同。其中唯一的差异在于这些虚拟机托管于一个第三方设施中并基本上从云中运行。当被保护设施的指示灯熄灭,同时调用灾难协议,那些虚拟机替代了物理机器和虚拟机器——接管生产机器。
该方法是SLA友好的。能够以可控的方式使用存储灾难恢复数据和应用程序的虚拟机。这一点可确保你管理系统能力和成本。如果一个业务单位基于Web订单处理系统的RTO为四小时,而一个常用但不重要的客户订单历史记录归档系统RTO为48小时,那么服务水平协议将要求灾难恢复产品立即恢复基于Web的订单处理系统,并在其后恢复历史记录归档系统。这一机制保留了恢复服务的两个目的:它降低了与任何时间相关的成本,并赋予忙碌的IT人员时间以确保首先满足更为关键的SLA。
这一分阶段恢复计划还允许用于消除灾难的时间。当然,还必须考虑到彻底破坏情况下的恢复计划;但是,在大多数情况下,灾难是指一次简单的失效。一旦发出失效命令并选中相关设施,你可能不需要为并不重要的SLA运行灾难恢复协议。