人们在业界交流时经常听到灾难恢复、业务连续性和备份等术语,但它们并不相同,如果企业希望妥善保护数据和关键任务业务系统,那么就必须了解它们之间的差异。
以下简要地阐述这些概念:
- 业务连续性计划描述组织如何应对灾难以及如何从灾难中恢复的内容。
- 灾难恢复是更大的业务连续性计划的一个要素。它通常是一种基于IT的解决方案,用于保持组织的数据和关键系统安全,以便在灾难发生后进行恢复。
- 备份可能是灾难恢复解决方案的一部分,但传统上它们不能自动执行应用程序恢复,而这是备份和复制技术之间的根本区别。
为了详细说明,以下是这些概念的一些主要区别和考虑,以帮助企业制定其策略。
业务连续性计划:第一步
业务连续性的讨论应该从企业的管理团队开始。企业的管理团队了解其核心系统宕机或中断的业务影响是至关重要的。并必须认真考虑一些典型的问题,其中包括以下内容:
- 企业需要哪些系统继续提供可接受的水平的产品或服务?哪些系统是不重要的?
- 如果应用程序不可用,还能继续开展业务创收吗?或者,如果应用程序不可用,会不会妨碍业务运营?
- 如何应对诸如自然灾害,网络威胁或流氓软件之类的破坏性事件?
- 如果数据中心宕机或电力中断,那么员工将如何继续工作?企业是否需要考虑采用业务连续性套件?
回答这些问题有助于企业确定哪些系统和数据是关键任务,需要备份的频率,以及发生故障时需要多久的时间才能恢复。
在行业调查中,约有50%的企业在业务连续性规划方面已经制定了正式计划,确定哪些系统需要先恢复,并说明灾难会对业务收入产生什么影响。而另一半企业没有这样的计划,但可以从与第三方合作进行正式合作中而获益。
最终,业务连续性规划是制定全面灾难恢复策略的第一步。然而,它往往被搁置一旁,其重要性只有在灾难来袭后才能得到充分认识。
灾难恢复:下一步
假设企业已经拥有一份业务连续性计划,那么现在是继续实施灾难恢复计划的时候了。这个过程应该总是从业务层面开始,但并不完全属于IT的范畴。
灾难恢复包括确定需要什么来支持组织的应用程序和基本数据。灾难恢复专家可以使用各种软件工具来帮助回答以下问题:
- 企业的服务器或虚拟机正在运行什么操作系统?
- 绑定了多少计算资源?
- 使用多少存储空间?
- 硬件版本是否相关,如果是,它们是什么?
- 哪种技术可以复制所需的工作负载?
在这个阶段,企业必须注意服务器和虚拟机之间的依赖关系。应用程序可能完全驻留在一个系统上,但应用程序通常驻留在多个虚拟机或服务器上,这大大影响了恢复过程。
备份,复制或两者兼而有之?
企业可能会定期备份数据或依靠云计算提供商为其提供数据备份。异地备份有助于确保数据的可生存性。
很多人错误地选择复制或传统备份仅基于应用程序的恢复时间目标(RTO)和恢复点目标(RPO)。备份绝不应该是独立的灾难恢复解决方案。复制是一种将近实时数据复制到新位置,并可在短短15分钟内恢复的备份系统,可以增强企业的安全策略。
当企业的数据中心遭遇灾难或事故时,从上次恢复点检索数据是主要优先事项。备份通常每天都在进行,因此如果企业之前的备份已成功完成并在异地复制,那么可能会损失数小时的数据,这其中可能包括销售、服务、结算、库存和其他所有数据。
企业还需要恢复可以访问自己数据的应用程序。异地备份计划只能备份应用程序数据,不能备份应用程序本身。如果它不包括操作系统和应用程序,则在开始恢复之前,企业必须协调替换它们。
其他考虑因素:恢复经济学和灾难恢复即服务(DRaaS)的兴起
在以往,规划灾难需要企业对IT基础设施进行大量投资。鉴于云计算技术和虚拟化以及复制技术的进步,现在大多数企业都可以轻松实现高级灾难恢复技术。云计算显著降低或消除了企业的资本支出,软件定义的流程减少了错误,并缩短了恢复时间。因此,企业可以更好地利用灾难恢复策略,以便在辅助站点或云中保持最新的资源,并且可以在几分钟内将它们联机使用。
值得注意的是,灾难恢复即服务(DRaaS)是一种相对较新的产品,通过提供目标环境、基础设施、技术和专业人员来帮助企业快速恢复,从而降低复杂性。根据调研机构Gartner公司的2017年魔术象限的灾难恢复即服务报告,人们已经看到客户对灾难恢复即服务(DRaaS)的需求在过去几年稳步增长,这可能是由成本降低或消除成本所驱动的。当然,云计算技术的广泛采用和相关的商业利益使灾难恢复即服务(DRaaS)成为一种值得探索的途径。
鉴于灾难带来的许多不确定因素(可能包括电力损失、水患、用户错误、恶意软件,或飓风等自然灾害),需要恢复备份并让业务运行起作用的人员可能会受到影响。由于没有人知道情况会怎样,因此最好尽可能简化和自动化企业的灾难恢复解决方案。在灾难测试和实际紧急情况下,更加简单和协调的灾难恢复总是更为成功。
结语
2018年是企业确保最新的业务连续性和灾难恢复计划并确定其团队战略定位的时候。随着基于云计算的服务的出现,灾难恢复的经济性已经发生变化,各种形式和规模的组织可以更加轻松地制定和实施其业务所需的灾难恢复计划。