从存储中分离数据管理有明显的优势。人们需要了解这种新方法如何使这些操作更简单、运行成本更低。
在这个数字化转型的时代,各种各样的组织正在成为以数据为中心的信息管理者。人工智能、物联网、5G和边缘计算等技术正在以前所未有的速度创造数据。这些数据正被用于提供更多的见解、服务、定制服务、产品和创新。而更为严格的个人身份信息隐私法规和对不遵守法规的严厉经济处罚正使情况变得更加复杂。
对于那些希望从比存储和使用成本更高的数据中获得价值的组织来说,有效的数据管理和存储正变得比以往任何时候都更加重要。将数据管理从存储系统中分离出来并独立运行是一种更好的数据管理方法。
当今的数据管理系统
根据供应商的不同,数据管理有多种含义。它被定义为接收、存储、组织和维护组织创建的数据。但这个定义已经过时了。对于传统的存储系统来说,它足够作为数据管理;然而,即使这样也不适合现代的存储系统。
如今的数据管理意味着更多内容,其中包括:
- 对数据进行分类;
- 聚合、收集和解析数据的元数据;
- 保护数据和元数据不受自然和人为中断的影响;
- 在内部部署和地理上移动数据,以进行共享、归档、复制、数据保护、存储系统技术更新和迁移,并访问所需的分析引擎,从而对该数据进行更深入的研究;
- 在进行一次或多次移动后,保持用户和应用程序对数据的透明访问;
- 提供用户可定义的策略,这些策略可自动移动、复制和删除数据;
- 部署人工智能和机器学习以优化和自动化大多数数据管理功能;
- 搜索数据并提供可行的信息和见解;
- 使数据符合个人识别信息法律和法规;
- 将数据管理扩展到数百PB甚至EB的快速扩展数据。
数据管理和存储面临的挑战
对于数据管理系统来说,做得很好是很难做到的。需要记住,数据管理和存储系统最重要的职责是接收、存储、组织和维护数据。所有这些其他数据管理功能都是资源密集型的,对系统的主要职责产生了负面影响。
这些分离的数据管理系统对IT组织产生了巨大的积极影响。
而且大多数存储系统通常不能与其他存储系统很好地协同工作。这对存储管理员来说不是什么新闻。而且许多系统在使用云存储时也有问题。很少有企业积极地使用磁带系统。
多供应商异构存储是一个更大的问题。存储供应商很少能彼此无缝地合作,这就是为什么以存储系统为中心的数据管理趋向于集中于一个供应商的原因。这种方法绕过了多供应商问题,同时将用户锁定在该特定供应商的数据管理和存储产品方面。
另一个数据管理存储问题是复杂的数据管理许可结构。当然,有数据管理软件许可,但不止于此。通常还有其他许可费用,例如存储系统移至云存储或其他存储系统的数据的容量许可费用。然后,有云存储容量许可费和数据访问的潜在出口费。此外,当用户和应用程序访问移动的数据时,通常必须将其重新移动到原始存储系统。数据移动需要时间为每个访问请求增加大量延迟。访问它所在的数据更有意义。
解决此问题的一种以存储为中心的方法是将组织的所有数据放在一个向外扩展,范围广泛的存储系统中,该存储系统将具有所有存储性能和成本层,数据保护、归档等,以及所有数据管理。
即使该存储系统可以满足每个性能要求,扩展每个层以满足数百PB或EB的数据,并且可以完成数据管理当今需要做的所有事情,但是还有其他棘手的问题。数据管理软件仍然会严重影响存储控制器。更重要的是,仍然必须将数据从当前位置移动或迁移到该系统。它无法解决多组织数据共享问题。
将数据管理与存储分离
这些问题导致了一种新方法,其中从存储系统中抽象了数据管理。数据管理软件在其自己的服务器硬件上运行。它位于带外、带内或两者结合。
抽象数据管理以三种方式之一捕获数据和元数据。它可以使用管理权限装载所有存储系统;DellEMCClarityNow、Hammerspace、iRODS(开源)、Komprise、SpectraLogicStorCycle,Starfish存储和StrongBox数据解决方案StrongLink可以做到这一点。或者它可以放在存储设备的前面,看起来像高速网络交换机,并且像高速网络交换机一样工作。通过第三种方法,它像Aparavi一样使用客户端或代理。这些系统中的大多数系统都在优化操作的软件中内置了一定程度的人工智能或机器学习。每种方法和供应商都有各自的优缺点。
这些抽象的数据管理系统对IT组织产生了巨大的积极影响。它们使存储系统商品化,减少了每层存储的数量和成本。他们通过将数据调整为适当的层大小,并消除供应商锁定来做到这一点。
简化的数据管理和存储操作
存储系统兼容性不再是问题。存储系统仅仅是根据数据的位置、性能和成本特征将数据驻留在其中的容器。这些抽象的数据管理系统还通过以下几种方式简化了操作:
- 它们通过自动数据归档简化了数据保护。在停机期间,无需恢复已归档的数据,要恢复的数据较少,恢复时间目标就越快。
- 它们有助于使用全局名称空间进行数据访问。数据是否移动到另一个存储系统、云存储或磁带都无关紧要;用户和应用程序仍然可以看到并直接访问其数据。
- 它们使存储系统的技术更新变得容易,并且在线过程无中断。
- 它们为DevOps、DevSecOps和测试/开发提供数据副本。
- 它们以惊人的速度迁移PB甚至EB的数据。由于收集元数据,组织在一小时之内就能将12PB的数据从一个磁带系统迁移到另一个磁带系统。
- 他们在组织之间共享大数据——这是以前不可能做到的。
扩展和许可要求
这些数据管理系统中的每一个都有不同的扩展比例。有些被设计为可扩展到数百PB和数百EB的数据。其他的则从TB扩展到数十PB。这取决于它们的架构,并且根据定义,大多数都与存储无关。
供应商有不同的许可要求。某些许可证通过TB的容量进行管理。其他的则根据热数据和冷数据来改变容量许可。还有一些许可证是根据在组织所需的性能级别上运行其软件所需的服务器和服务器核心数量来许可的。
外部分离数据管理是什么意思?这意味着IT组织可以根据成本和性能而不是数据管理功能来选择存储。这意味着存储供应商将不再拥有现有优势。这意味着简化了IT运营并降低了成本。在数据管理和存储方面,这一切都预示着未来的美好前景。