改进灾难恢复策略的九个建议

存储
无论组织是否已经制定完善的灾难恢复计划,还是刚刚开始实施,需要了解将其灾难恢复策略提升到更高水平的方法。

无论组织是否已经制定完善的灾难恢复计划,还是刚刚开始实施,需要了解将其灾难恢复策略提升到更高水平的方法。

无论组织采取多少安全措施来保护其资源,最终不可避免地会发生一些故障、失败或其他灾难。在实施灾难恢复措施时,最好是做好准备,而不是匆忙地决定和实施计划。

[[358097]]

由于现代企业都依赖于数据和IT基础设施,因此灾难恢复(DR)计划是业务运营的重要组成部分。面临的灾难事件从网络攻击到硬件故障,再到小规模的停电,所有这些问题都会导致停机,从而使组织面临糟糕的客户和员工体验、声誉受损和盈利能力下降。

采用可靠的灾难恢复计划,企业可以更快地恢复数据,并显著减少损失。无论组织开始制定灾难恢复策略,还是已经制定了正在寻求改进的策略,以下九个建议都将能够改进灾难恢复计划,并帮助从组织遇到的任何灾难中快速恢复。

1. 拥有完整的文档

文件存档从来都不是一件有趣的事,但是记录组织的灾难恢复计划是全面、快速恢复的重要组成部分。

其文档应包括恢复计划的目的和方法、每个策略的步骤、每个角色的职责以及计划每个阶段涉及的角色。其语言应该清晰明了,以便任何人都能按照指示行事,高级管理人员应具有明确的指挥系统,以防发生灾难。

如果组织没有制定策略文件,灾难恢复负责人不在现场或在灾难期间无法联系,则可能会造成极大的破坏,因此必须立即执行这一步。

2. 评估风险

业务中所有最佳实施的事情都始于风险评估,灾难恢复也不例外。而良好的灾难恢复策略将考虑业务的所有功能领域,了解面临哪些潜在威胁以及依赖哪些IT资源。

完整的IT清单和数据审核可以通过识别关键软件应用程序,以及运行它们所需的任何硬件基础设施来帮助完成此任务。

风险评估还应考虑任何可能影响外部合作伙伴和服务供应商的问题,尤其是在云计算环境中,这将构成灾难恢复计划的基础。

3. 灾难演习

组织为其数据中心设施制定疏散策略并不能阻止火灾的发生,但是定期进行消防演习意味着,当警报响起时,每个人都知道该怎么办以及要去哪里避险,并且在理论上都要安全撤离。

灾难恢复策略需要进行定期的测试,以确保每个流程和系统都能正常工作。组织制定有效的灾难恢复计划是目标,但是让人放心的是,如果发生灾难,将会遵循该计划。

4. 为不同级别的灾害做好准备

灾难的类型和规模多种多样,如果组织不做好准备,有时一个小灾难就可能导致更长时间的停机。

良好的灾难恢复策略将对不同级别的灾难做出不同程度的响应,以确保较小的问题能够让负责的团队立即处理。

5. 采用云计算

并非所有基于云计算的灾难恢复系统都是以相同的方式工作。其中一些提供基于云计算的备份和恢复,而其他一些则使用虚拟化来维护服务器和应用程序的副本,数据从生产系统复制到虚拟化的故障转移系统。

云计算灾难恢复具有其优点和缺点,但与许多基于云计算的服务一样,它可以被广泛使用,而无需备份和恢复硬件的前期投资成本。

6. 优先考虑弹性

灾难恢复是IT服务组织希望永远不会被使用的服务之一。这就是为什么将弹性作为IT基础设施中的指导原则很重要的原因。

确保基础设施具有弹性,这需要良好实践以及对技术和服务的投资,这些技术和服务既支持业务,又可以最大程度地降低故障风险。

在追求弹性时,最重要的原则是避免出现单点故障。如果关键应用程序是在某台服务器运行的,并且只能在这台服务器运行,那么这就是一个潜在的弱点。

作为灾难​​恢复策略的一部分,需要评估组织中硬件和软件的弹性,并查看是否有任何需要改进的地方。

部署故障切换设备、不间断电源、备用发电机和备用服务器都有助于降低故障风险。

7. 评估安全实践

安全本身是一个单独的主题,但与灾难恢复策略有着千丝万缕的联系。从理论上来说,良好的安全措施将最大限度地降低灾难恢复计划必须执行的风险。

但是,作为全面灾难恢复策略的一部分,应该评估安全性方面的潜在弱点,并在必要时采取措施以加强安全措施,并制定应对特定防御措施的计划。

8. 修改和重新访问

一旦组织灾难恢复计划到位,就很容易搁置它。但是,随着新技术的采用,新员工的加入以及企业内部情况的变化,应该对策略进行修订。

例如,如果实施了一项新的云计算技术,则灾难恢复计划应更新为这一特定工具的特定策略,包括备份数据的方式和位置,以及如何恢复数据。

9. 建立关键的响应团队

如果没有使系统恢复所需的在线人员,就无法实施分步恢复策略。关键的响应团队除了现有内部人员外,还应包括外部联系人,例如软件供应商。

需要明确定义灾难恢复的角色和职责,强调需要全面的文档和培训。拥有更多分布式资源和专业知识的大型组织将发现自己更有能力执行恢复计划,因为它们可以利用来自多个位置的资源,具体取决于经历的灾难的类型和位置。

具有讽刺意味的是,此处的最佳实践是组建备份团队。通过确保团队中的每个角色都有一个影子成员,在不合时宜的灾难情况下,组织仍有人可以介入以填补空缺的角色。

组织还必须考虑团队成员之间的沟通。通过多种方式与每个成员联系,并在灾难恢复计划上明确联系方式,组织可以快速有效地做出反应。

 

责任编辑:赵宁宁 来源: 企业网D1Net
相关推荐

2019-11-06 11:20:39

灾难恢复策略测试

2018-04-18 10:28:15

数据中心灾难恢复DR

2011-08-09 09:31:10

云计算灾难恢复

2021-06-08 14:21:51

恢复策略数据备份存储元素

2020-12-02 10:35:09

云端灾难恢复云迁移

2016-10-19 14:37:09

2013-05-30 09:19:31

灾难恢复故障排查运维

2016-12-02 10:34:21

2017-12-08 20:32:39

2021-06-11 11:45:19

日志管理攻击网络安全

2012-09-17 11:25:32

IBMdw

2010-12-15 10:12:05

开源Xen灾难恢复

2017-12-19 07:04:01

多云云技术自动化故障

2020-06-16 09:30:09

云计算IT公共云

2023-06-27 17:37:08

Kubernete容器集群

2020-03-02 10:03:39

边缘计算灾难恢复网络

2012-02-06 09:58:48

2024-04-08 11:01:54

2010-07-23 16:30:30

灾难恢复业务连续性

2019-08-08 10:50:50

安全灾难恢复技术
点赞
收藏

51CTO技术栈公众号