当今市场上几乎所有备份解决方案都要求具有某种形式的云存储支持。IT规划人员需要了解他们的备份解决方案提供哪种类型的云存储,以及其解决方案的体系结构是否可以真正利用云存储。令人惊讶的是,大多数数据保护解决方案虽然支持云存储,但实际上并没有带来什么价值。毫无疑问,云存储可以成为备份基础设施的一个具有价值的补充,但其前提是备份软件的架构能够充分利用它。
在了解备份软件解决方案如何使用云存储之前,IT专业人员必须了解使用云存储背后的“原因”。利用云存储作为备份基础设施一部分的主要原因是降低备份存储成本。
令人惊讶的是,将云存储成本与本地备份存储进行比较可能不会立即显示出成本的节省。备份存储系统(例如高容量、重复数据消除的存储设备和磁带库)可能比云计算提供的订阅模型具有价格优势。但是,这些初步的比较具有欺骗性。他们并没有考虑到组织需要预先支付本地存储费用。而在完全使用存储系统的容量之前,组织并没有意识到节省的成本。一旦考虑到总体拥有成本,许多组织就会发现公共云存储是一种更经济的存储备份数据的方式,尤其是在数据保护软件智能地使用云存储的情况下。
使用云存储的另一个优点是它会自动创建数据的异地副本。组织无需为配备灾难恢复数据中心或在其数据中心中维护另一个备份存储系统而进行操作或支付费用。云存储还可以自动扩展和刷新。IT团队不再需要担心升级其当前备份存储硬件,如果担心正在使用横向扩展备份存储系统而添加节点,至少从客户的角度来看,云存储会自动扩展。
了解备份软件如何使用云存储
备份软件使用云存储有三种常见方式:第一个是云计算镜像,它实质上将所有备份数据从本地复制到云中。内部部署备份数据从未存档,备份数据的云计算副本用于灾难恢复。因此,客户只能看到备份存储成本的适度降低,因为它消除了第二个备份存储系统和维护第二个站点的成本。
备份软件使用云存储的第二种方式是只使用云存储,与云计算镜像相反。此方法只在云存储上独占存储数据。仅限云存储备份数据的方法显著降低了本地备份存储基础设施的成本。该组织还获得了上述云存储的所有好处。问题是,只使用云计算的方法会引入云延迟,这会影响备份数据的查询和恢复时间。
备份软件使用云存储的第三种方式是云分层,它在利用本地和云平台方面提供了更好的平衡,随着时间的推移将较旧的备份作业移到云平台中。问题在于,云分层仅对特定数据集具有意义,并且备份软件必须智能地利用这两个层,以便客户看到好处。
组织的备份软件会从云分层中获得全部价值?
行业研究机构发现,超过85%的恢复请求来自前一天的备份。从理论上讲,如果组织仅在本地存储两个或三个最新的备份数据副本,则这两个或三个版本应该可以满足几乎所有恢复请求。该机构还发现,超过65%的组织具有超过五年的备份保留策略。如果组织将几周之前的任何备份数据存档或移动到云存储中,则可以显著减少本地备份基础设施和成本,同时又不牺牲其满足各种服务级别目标的能力。
什么类型的数据可以进行云分层?
为了从云分层概念中获取全部价值,IT团队需要将其应用于正确的数据集,而备份软件则需要以能够智能地将其归档到云中的方式来存储信息。当今大多数组织中有两个需要关注的数据集,即数据库和非结构化数据。数据库由记录(或行)组成,并且用户几年甚至几十年都没有访问过其中一些记录。问题是,如果IT团队需要满足对数据库的恢复请求,则IT团队需要还原整个数据库。在大多数情况下,数据库无法在本地部署20%的数据,而将80%以上的数据保留在云中。由于从云中恢复数据库的速度很慢,因此大多数组织需要将其数据库备份副本的100%保留在本地。
第二种数据类型是非结构化数据,即用户和计算机创建的文件。由于每个文件都是独立实体,因此其他文件通常不依赖于该文件,因此将较旧的文件备份版本存储在云存档中是有意义的。非结构化数据可为云分层投资提供更高的回报,因为非结构化数据消耗的容量通常比结构化数据要大得多,并且在紧急恢复的情况下,组织仅需要最新创建或更改的非结构化数据版本。
备份软件将如何支持云分层?
备份软件对云分层的支持在很大程度上取决于备份软件存储数据的方式。大多数备份应用程序都将结构化和非结构化数据存储为它们正在保护的卷的映像。基于图像的备份是保护非结构化数据的一种特别流行的方法,因为备份软件不需要经过非常耗时的过程,即扫描可能数以百万计的文件来查找新的或更改的文件。备份软件将非结构化数据所在的整个卷备份为一个大对象,以创建基准基础副本。后续备份扫描卷以查找更改的块。如果在扫描期间出现新的或更改的块,则这些块将一起存储在增量备份作业中。如果备份管理员希望将卷恢复到最新版本,则备份软件将首先恢复卷的基准副本,然后从增量备份中覆盖已更改的块。
大多数基于映像的备份解决方案要求IT人员在完成相对少量(4~6个)的增量作业后,定期创建新的基准映像。该软件可以通过将增量作业合并到基准映像中来创建新的基准映像,或者IT团队可以运行完整的备份。但是,这两种方法都非常耗时。
在基于映像的备份作业中,可以进行归档的唯一组件是软件或IT创建新基准之后的较旧基准副本。问题是新基准和旧基准的大小非常相似。尽管组织并未像云分层所暗示的那样节省总容量,但确实节省了一些容量费用。通常,组织在本地存储较旧的基础备份副本,但现在他们可以将它们存储在云中。问题在于云存储层在基础副本之间具有高度的冗余,因此组织每月要支付额外的费用来存储相同的数据副本。
下一代逐个文件备份解决方案
相比之下,逐个文件备份确实扫描了整个非结构化数据集。与基于图像的方法相比,这些扫描更加耗时。但是,下一代非结构化备份解决方案在原始扫描(尤其是后续扫描)所需的时间上有了显著改善。传统的逐个文件备份除了扫描速度较慢外,还仍将每个逐个文件备份作业存储为单个卷。主要原因是为了更有效地将数据保存到磁带。将10,000个1兆字节的文件写入磁带是一项长时间的操作。下一代非结构化备份解决方案既可以将数据写入本地磁盘又可以将数据写入磁盘,并且可以存储文件,因此可以对它们进行精细访问。精细的文件存储不仅使这些下一代解决方案能够提供对备份文件类型的深入了解,而且还可以更智能地使用云计算。
下一代解决方案不需要执行整合作业来创建新的完整性。在初始扫描之后,软件可以继续以增量方式长期备份文件系统。增量永久策略加上详尽的洞察力,意味着下一代非结构化数据保护软件还可以基于更改率、类型或分类将特定文件从本地备份存储细粒度地移动(而不是复制)到公共云存储。它可以使用相同的信息将更重要的文件保留在本地,以实现更快速的恢复。
这些新一代解决方案的细粒度移动功能可以显著减少本地备份数据集的大小。与基于映像的备份解决方案相比,它还可以显著降低云存储层的大小要求,因为它不会连续地将相同的数据复制到云平台上。
这些下一代非结构化数据保护解决方案的一个重要组成部分是维护有关本地备份的元数据。元数据信息的本地副本意味着组织可以在不访问云计算副本的情况下执行所有查询。其结果是备份软件能够快速响应查询,而不会招致云计算提供商的出口费用,而且该组织能够使用云计算提供商提供的最深层的存档层。
结论
对于许多组织而言,使用公共云存储作为备份存储是有意义的,因为它具有降低成本的潜力。IT部门面临的挑战是确保备份软件将正确的数据集分层到云中。通常,组织不会通过对结构化数据进行分层来节省费用,如果这样做,则可能会满足恢复预期的风险。如果备份软件可以精细地保护非结构化数据并将其精细地移动到云中,则非结构化数据可以通过智能地利用公共云存储来节省大量资金。