虚拟化为IT带来了无以伦比的灵活性,利用虚拟化,数据中心可以把工作负载各个服务器之间迁移——甚至可以在数据中心间迁移。因此,虚拟化也肩负了灾难恢复准备的责任。但是灾难恢复计划不是随便就能实现的,需要仔细的计划和定期测试,以保证公司和人员能够在问题发生时顺利执行恢复。
TechTarget数据中心网站Advisory Board的专家分享了他们在虚拟化环境中灾难恢复计划的见解。讨论了如下的问题:虚拟化环境如何改变灾难恢复的准备、工具和步骤?虚拟化对数据中心灾难恢复会带来什么样的问题和挑战?会给IT人员及其发展带来什么影响?
有两个理念为灾难恢复计划带来了革命:把所有服务器存放在一个SAN上的方式,以及虚拟化概念的提出。过去,灾难恢复主要要做的是反映物理设备,做好异地备份,确保数据中心能够应对断电等紧急情况。有了虚拟化之后,IT人士意识到它在灾难恢复方面的潜力,虚拟平台更容易迁移、备份和恢复。几乎每个大型数据中心现在都有虚拟化解决方案,所以一定要改变灾难恢复计划,以更好的配合虚拟化技术带来的好处。
有了物理服务器,你就得把工作负载复制到另一台不在工作的物理箱中。有时候这行得通,有时候却不好整。有了虚拟化之后,就可以从最近的快照提取,而不是重建物理箱。故障转移工具现在允许整个工作负载都从一个物理主机迁移到另一个物理主机,仅仅基于虚拟化池的硬件故障。很多时候这是自动化的,用户之间的交流保持最小化。因为虚拟机在SAN上存储,它们可以复制到云上,甚至通过SAN to SAN技术克隆。这些在以前的传统环境下是很难的。
但这会带来危险,将complacency和灾难恢复计划结合在一起不是个好主意。虚拟化灾难恢复会比较顺利,但是工程人员还得时刻注意他们的环境。关键在于了解技术和最大限度利用工具。工作负载可以实时迁移,终端用户可能感觉不到区别。你要通过练习保证所有你地虚拟化平台更新并且工作良好。
灾难恢复计划不管是物理还是虚拟化的,都得经常测试。基于环境的大小,有的组织每周测试,有的每个月测试。有很多可行的测试。例如,想要测试物理硬件的故障,工程人员可以直接关掉其中一台物理箱的电源,来保证他们的虚拟机负载能自动平衡到另一个可用的服务器上。在自动迁移到虚拟物理主机时,可以测试网络能力、故障和虚拟机健康。另一个测试方法可以确认所有不在线时的快照可用。只要从一个快照中,加速一台虚拟机,就可以确认数据整合有没有花太多时间。
物理和虚拟灾难恢复计划是不同的。在虚拟化环境,人员必须非常熟悉他们的监控管理平台——不管是VMware还是XenServer。工程人员得了解如何使用这些平台,快速排查故障,还得训练使用软件中所有的灾难恢复功能,并且定期测试环境。实践是最有效的方法。