能够存储TB级或甚至PB级数据的是桌面数据。数据管理的方式决定了数据驱动的组织在提供价值和控制成本方面的有效性。问题是大多数文件系统和数据管理解决方案将数据保管到单一介质类型或供应商。数据是流动的,它对性能、价值、保护和位置的要求随着时间的推移而变化,文件系统应允许数据遍历供应商,媒体类型和位置。
非结构化数据正在以惊人的速度增长。其增长的主要原因不仅仅是用户创建数据的增加,而且还有机器和传感器创建数据的增加。数据增长并不是什么新鲜事物,其增长速度以及利用数据分析和人工智能等手段来战略性地利用数据的愿望。而非结构化数据的新的访问和性能要求更令人惊讶。
数据价值随着时间的推移不断过时,最终永远不会再被访问。如今的数据,特别是机器和传感器创建的数据,可能在初始创建后的短时间内非常活跃,很快就会休眠,然后再次变得活跃起来。而且,当用户需要它时希望立即获得。一些组织不能忍受几个小时才能提供数据。
同时,一旦激活,这些数据可能需要非常快速的处理。其中的数据是什么类型的媒体数据成为关键。
快速创建,长时间的休眠,以及突发事件这些因素促使组织采用各种NAS解决方案来满足这些不同的需求。然后,他们经常被迫在系统之间以人工方式移动数据,或以某种方式修改其应用程序以访问跨系统的数据。最终多个系统没有统一的标准,会导致成本增加,性能下降,管理更加复杂。
容量管理的挑战
IT团队在确保正确的非结构化数据在正确的时间正确的位置,存储在正确类型的存储设备上面临着重大的挑战。在这种情况下,传统的解决方法是把所有的数据存储在一个初级的NAS系统。这种解决方法已不复存在。将所有非结构化数据保存在主存储设备上太昂贵了。
由于许多主要存储系统现在都是全闪存或闪存系统,因此主存储器的成本更加复杂。虽然闪存的价格正在下降,但它仍然比硬盘更昂贵,尤其是以容量为中心的硬盘存储器。
过去,IT团队面临的***挑战是创建一个足够大的存储池,用于存储组织的所有非结构化数据。由于如今具有先进的文件系统和横向扩展的存储架构,原始容量不再是问题,所以需要更有效地利用容量。
当今的容量目标
IT团队的目标是确保非结构化数据在任何给定时刻都是***成本效益的存储介质,系统和设备,同时也可以根据该数据集的要求快速,无破坏性地移动数据。
为了实现容量目标,横向扩展的NAS2.0系统不能局限于单个存储架构甚至单个存储位置。当数据处于活动状态时,它应该利用高性能硬件,然后在数据活动较少时将数据移动到其他存储类型。例如,如果数据需要长期保留或保留一段时间,则将该数据移动到具有强遵从特性的存储系统是非常理想的。如果数据未处于活动状态,但可能再次出现,则将数据移动到有效但易于访问的存储层是另一种选择。或者如果数据可以通过云计算而不是内部部署计算更好地处理,那么将其移动到像AmazonAWS这样的公共云提供商应该是一个很好的选择。
但关键是数据的移动应该是透明的、自动的和策略驱动的。透明度至关重要,因此应用程序和用户可以访问数据而不改变工作流程。自动化非常重要,因为IT团队已经超负荷工作,没有时间来管理数据移动,尤其是非结构化数据集,这些数据集可能有数百万份与它们相关联的文件。
同时,数据移动应该是策略驱动的,以便在有意义的情况下覆盖自动化。例如,一些工作流程可以预测何时需要数据集,或者当一个特定文件的访问意味着将访问目录中的其他文件时。策略允许将数据预先迁移到更高级别的层次或者数据层级的积极移动
横向扩展NAS2.0系统需要能够利用***数据存储要求的多种类型的存储架构,并能够在需求变化时移动数据。如今,大量的存储架构和系统可以满足组织的容量要求。扩展NAS2.0应该利用多种类型的存储系统和位置,如私有云或公共云存储甚至磁带,然后提供一个智能层在它们之间移动数据。