多年的数据备份使许多组织拥有难以追踪和管理的多个数据副本。数据访问也成为一个挑战。当应用程序所有者想要生成数据的副本时,他们必须经常向IT提交一张请求单,并等待几天甚至几周才能得到响应。
这些数据管理实践不是最佳的,并导致了高于必要的存储成本、数据合规、敏捷性和生产力限制等问题。此外,数字转型正在推动数据量的大幅增长,恶意行为也普遍存在。 考虑到这一切,很容易看出为什么大多数组织将数据保护和辅助数据环境现代化作为重中之重。
拷贝数据管理(CDM)是这些问题的一个令人兴奋的答案。它专注于保护生产数据和改进生产数据副本的管理。目标是降低存储成本,提高数据可见性和合规性,并加快数据访问速度。
CDM市场发生变化
直到去年,CDM市场大多是来自Actifio和Catalogic Software等公司的产品。但随着一些最大的存储和数据保护供应商的涌入,CDM市场正在迅速变化。
EMC(现为Dell-EMC)和IBM在去年推出了CDM产品,而今年初,Veritas与Veritas Velocity CDM共同出货。供应商对CDM感兴趣并不奇怪,因为它是存储和数据保护产品的自然延伸,许多公司也早已从前期评估过渡到实施CDM。2017年Taneja集团的研究发现,超过30%的公司正在评估CDM产品或实施CDM产品。
那么公司最看重的CDM功能是什么呢?供应商如何响应用户对CDM功能的需求?这些问题的答案可资理解CDM在哪一块市场有最大用武之地。他们还确定哪些供应商正在率先提供通用数据可视性,即时访问数据,自动化数据保护以及利用混合和多云环境的数据可移植性。
CDM优先功能
Taneja集团统计了众多IT专业人士的意见后,发现最受认可CDM功能的前三项为,降低存储成本,更好的数据可见性、洞察力和合规性,以及将辅助存储作为数据保护的能力。另外,使用DevOps工作流程、更好的数据生命周期管理,和自动化复制管理也在前5大CDM功能之列。
客户经常指出降低存储成本的重要性。压缩和重复数据删除已经成为数据保护产品长期以来的重要组成部分。CDM供应商(如Cohesity)可以通过全局可变长度重复数据删除来最大限度地减少数据,从而在整个存储空间中运行。Actifio还提供全局重复数据删除功能,Dell-EMC企业版CDM(eCDM)和Veritas Velocity分别在实施为Dell EMC Data Domain和Veritas NetBackup的扩展时提供全局重复数据删除功能。
降低存储成本的另一个方面是易于维护存储系统。 Cohesity的DataPlatform在这里设置了高标准,其超级融合存储架构具有固有的简单性,它简化了节点故障的系统升级和恢复,因为没有中断,没有手动配置,也不需要数据迁移。
能灵活使用经济高效的存储也很重要,因此与专用设备无关的一体式CDM产品就具有优势。例如Dell-EMC、日立和IBM之类的存储公司优先考虑特定存储设备的CDM支持,但独立软件提供商(如Catalogic和Commvault)则可为各种存储设备提供一体式支持,只要使用它们提供CDM支持的存储阵列的本机快照和复制功能。具有横向扩展体系结构(如Cohesity DataPlatform)的CDM产品使用在工业标准化硬件上运行节点。支持灾难恢复即服务的CDM供应商可以通过消除维护多个物理数据中心的需要,进一步降低存储成本。
数据可视性提高
降低数据副本的数量是降低存储成本的另一种方法,这也是受访者普遍强调的另一项重要功能:具有更好的数据可见性,洞察力和合规性。所有CDM供应商都提供了一个全面的元数据目录,提供对物理和虚拟资源的洞察,让管理员快速确定复制数据的生命周期和数据访问时间。复制数据管理供应商还提供分析预定义报告,带过滤器的仪表板,以及根据特定需求创建自定义报告的能力。
搜索是另一个重要功能。搜索过滤器可帮助管理员快速查找符合特定条件的对象,例如虚拟机(VM),特定位置的卷或大于特定大小的数据副本。这里突出的复制数据管理市场的供应商是提供深度文件搜索功能的供应商,这是安全合规性所必需的。
CDM的核心租户正在向应用程序所有者提供快速自助访问数据副本。这是调查统计得来的另一个重要功能:“为DevOps工作流启用自动复制创建和管理”。开发人员,质量保证人员和数据库管理员已经推出了这一功能,要求及时的数据访问和无需IT参与的能力。自助服务已成为受欢迎的CDM用例得到市场上所有主要厂商的支持,许多公司也正在部署。根据Actifio,DevOps或测试开发者数据管理的自助服务日益成为客户部署的第一个CDM用例。Dell-EMC报告说,应用管理员现在可以做20%到25%的客户的备份工作,无需通过集中式IT。
通过自助服务向应用程序所有者和管理员提供实时访问,包括使用服务架构,门户或市场查找,配置和管理资源;基于角色的访问控制;数据虚拟化集成生命周期管理;数据屏蔽或混淆;并与开发工具,数据库工具和管理平台集成。应用程序和数据库支持可以是一个区别,供应商还在不断扩大其支持的虚拟和物理应用程序和数据库的列表。IBM最近在物理服务器上增加了对SAP HANA,EPIC Cache数据库和Microsoft SQL Server的支持。
数据生命周期管理
CDM还通过基于策略的业务流程实现数据生命周期管理。真正的自动化需要能启停整个基础设施,这意味着创建提供数据副本的策略,设置网络参数、刷新频率和保留期限,并根据需要清理副本和虚拟机。
CDM市场的所有主流供应商都提供基于策略的业务流程,但是管理服务级别协议(SLA)合规性和云支持可以区分供应商资质。例如,当涉及到SLA服务质量全面监控SLA合规性时,Dell-EMC的eCDM提供了全面的功能。此外,拥有视觉工作流程构建器有利于易于使用,日立的Data Instance Director在这方面很强大。
公有云支持已经成为数据生命周期管理的一个重要方面。寻找提供基于策略的云分层的供应商,用于数据归档和支持按需云工作负载以及云中的灾难恢复。此外,寻找支持主要公共云 - Amazon Web Services,Google Cloud Platform和Microsoft Azure的供应商,并提供本机云支持,而不是依靠第三方云网关。Actifio,Cohesity和Dell-EMC都提供广泛的云支持。
整合二级工作负载
另一个高级功能是整合二级存储工作负载或用例(例如备份,数据归档,测试开发和分析工作负载以及共享文件服务)的能力。灵活性和可扩展性是在工作量整合中发挥重要作用的两个因素。它们通过支持多个存储设备启用:多种协议,如iSCSI,NFS,SMB和Amazon Simple Storage Service;以及多个管理程序或虚拟环境,包括Microsoft Hyper-V和VMware vSphere。大多数供应商开始采用VMware vSphere支持,然后添加对Hyper-V和其他虚拟机管理程序(如Oracle Virtual Box)的支持,但并不是CDM市场中的所有供应商都支持所有环境。
应检查对虚拟环境的深度支持。在VMware环境下评估CDM方案,应向供应商询问有关VMware VStorage API数据保护、vSAN和vRealize Suite的支持。可扩展性是工作量整合的另一个重要因素。供应商通常支持扩展架构,或通过添加磁盘来扩展容量的能力。一些供应商提供横向扩展架构,客户可以通过添加更多节点来水平扩展。横向扩展架构对大多数公司来说不太熟悉,但值得考虑。例如,Cohesity提供了一种横向扩展架构,可使吞吐量和IOPS随着群集大小线性增加。这有助于公司在不影响性能的情况下整合工作负载并随着存储需求的增长而扩展。
很难说CDM在重要性和应用方面是否成为数据保护的代名词。但客观地说,CDM正在走向主流。许多公司正在考虑,评估和实施复制数据管理,因为它们超越了集中式数据保护和现代化二级数据环境。在这样做时,他们正在为文件服务提供生产数据和辅助存储副本的按需自助访问,以及使用索引、高级搜索和分析来查找不合适的机密数据,并确保数据合规性。