在一个数据中心里,某个地方发生了火灾,并迅速蔓延到了距离服务器只有几个房间的地方。尽管数据中心的消防部门在不到10钟内扑灭了火灾,服务器安然无恙。但是冷却和电力等基础设施却被全部损坏,甚至一些连接到服务器的线路也受到波及。在接下来的几个星期里,这个数据中心都不能正常的工作。
于是,在接下来的时候,由于没有服务器能够工作,无法正常的和客户联系,这意味着企业将的业务会受到严重的影响。而在IT部门,似乎没人知道如何让备份的系统以及应用程序工作。可能首席技术官知道,但灾备计划是几年前完成的,他也不清楚其中的细节。而制定那个计划的人却在西藏登山,通过电话和电子邮件显然不能够让数据中心更好的恢复正常工作。
这并不是一个不着边际的假设,而是一个随时可能发生的情况。由此可见,建立一个完整的灾备计划并认真的执行是多么的重要。即使出现了最坏的的情况,企业的服务器也能够快速的恢复正常运行。#p#
确定优先级
由于应用程序和数据的重要性的不同,因此灾备计划应该考虑在灾难发生的时候哪些应该优先得到恢复。在规划灾备计划的同时应该选择那些优先恢复的服务器,来尽量减少客户等待的时间。如果有10台服务器,可能有3台服务器上运行着关键性的任务,需要24小时运行。但有些服务器就不太重要,即使关掉几天,对企业的业务也不会产生什么影响。
而划分这个优先顺序也包括收集除了IT部门以外其他部门的服务器使用状况。即使IT部门以及客户的服务器全部恢复了正常,但收发邮件的服务器却没能恢复工作,那么其他部门也不能正常工作,甚至会直接影响到企业的管理。
另外,即使有了完整的灾备计划,如果不能很好的执行也没什么用。如果只有一个人了解这个计划,如果出现问题的时候他不在,这显然是个很悲剧的事情。所以灾备计划应该存放在硬盘里或者打印出来,并让相关的人员知道。而出现问题的时候,工作人员也应该知道该和谁联系,来确保在最短的时间内让数据中心恢复正常的工作。#p#
仔细规划
灾备计划的规划是一个持续的,不断演进的过程,制订好了灾备计划就等着灾难的发生是一个显然错误的观念。
虽然管理员在不断的评估数据中心网络容量的需求,但不要忘了灾备计划也占其中的一部分,要留给备份所需的空间。这并不是一个可选部分,而是一个必要的部分。因为包含了数据和应用程序的备份计划,在灾难发生的时候就会显示出它的价值,快速的帮助企业恢复业务是花多少钱也买不来的。
整个计划还包括远程战略。当发生灾难的时候,必须要确保管理员在异地也能启动灾备计划。而发生灾难的时候,太多的人参与计划反而起不到积极的作用。在这个领域,不会需要太多的帮助,有时候反而会导致更糟的事情发生。
所以灾备计划应该确定哪些人分别负责哪些工作。并且让工作人员们清楚,什么是应该做的,什么不应该做。#p#
不要忘了企业
由于管理员在选择灾备计划的时候往往从技术方面来考虑,他可能忘了,灾备计划的规划首先必须服从于企业的业务需求。在今天,虽然IT的基础设施随着虚拟化,云计算技术的发展,结构发生了很大的变化。但是,业务的连续性和灾难恢复的联系依然是密不可分的。
规划灾备计划的根本原则并不是技术的可行性,而是那些业务所依赖的服务。毕竟,数据中心也是为了更好的为企业提供服务。不仅仅的企业数据中心,云计算服务提供商,托管服务提供商都必须要有良好的业务连续性,并让它的客户清楚的知道。才能保证他的优势。
因此,尽管灾难恢复解决方案在不断的发展,但最根本的灾备计划仍然是一致的。保证业务的连续性也是制定灾备计划的根本意义所在,也是最大限度的提高灾难恢复效率的唯一出发点。