随着软件定义存储的崛起,存储服务通过软件层实现,数据存储正在被重新定义。随着计算与存储融合的发展,存储平台和数据处理平台之间的差异正在进一步削弱。
存储的新形式
我们来看看存储进入新领域的几种方式:
容器化。进一步说明,几乎所有的新款存储操作系统都被写为容器化应用程序。事实上,我们听说一些传统存储系统正在转化为容器化形式。不只如此,它能够更好地处理大规模扩展、提升可用性、云部署友好性以及更容易支持在存储内进行聚合计算的能力。
兼容并蓄。超融合将软件定义的存储设计成便利的模块化设备单元基础设施。超融合基础设施产品,如惠普Enterprise SimpliVity与Nutanix,可大大减少存储开销,并帮助构建混合云。我们还发现合并存储与计算的创新的方法,即使用服务器端闪存(如Datrium)、机架基础设施池(如Drivescale),甚至在每个磁盘驱动器上集成ARM处理器(如Igneous)。
越大越好。大数据的兴起意味着掌握更多数据,就有机会从数据中挖掘价值。当今的大数据分发结合了Hadoop和Spark生态系统、各种风格的数据库,横向扩展系统管理成为越来越多的通用数据处理平台,所有这些都由基础大数据存储工具(例如Hadoop分布式文件系统、Kudu、Alluxio)提供支持。
越快越好。除了大之外,又快就更棒了。如今又有了新型的自动分层与缓存的大数据存储与围绕集成数据管道而设计的数据访问分层产品。很多这类工具是真正融合的大数据平台,用于物联网(IoT)规模的大数据与流数据。
基础的改变
很多案例背后的驱动力是底层技术的转变。
新的数据处理平台比过去任何时间要处理更多每单位数据的元数据。更多的元数据导致了新的、高效的创新方式,例如统一对象、文件和块服务;并提供***的虚拟快照,自动文件归档和虚拟机优化的应用程序存储。
其次是数据位置。让计算和数据彼此接近能够优化性能与效率。十年前,Hadoop展示了如何通过将计算映射到分区的本地数据块来处理大数据,尽管仍然以批处理查询方式进行。今天,我们看到新的数据处理设计,在实时流数据上保留或增加数据的位置。无论是利用密集的服务器端非易失性存储器还是分布式内存网格,在存储中托管用户计算功能层或在物联网边缘进行计算,数据位置都是获取成功的关键。
当今的技术正在模糊基础设施存储、后端数据库和活动应用程序数据集之间的界限。我们现在有许多NoSQL和NewSQL变体提供不同的架构方法来扩展并保障一致性。我们有流服务,用于处理流水线和消息队列中的数据。我们有活跃的数据湖泊、在线归档和分析数据库以及更传统的操作SQL方法并入统一数据处理平台。将数据化作数据生命周期管理的单独阶段或环节将越来越困难。
期待已久的,且几乎神话般的混合云存储概念终于形成了。鉴于所有异质及多供应商难题,将存储自动分层为缓存、弹性云存储、本地二级存储甚至应用程序数据本地存储的想法看似简单,却很难实现。
但是,我们都希望存储能够无缝、自动而且跨越内部部署存储到公共云端,从而使我们能够根据需要轻松地使用和移动数据——无论何时何地。新的供应商正在将二级存储与第三方公共云集成(如Igneous),但是Oracle已带着ZFS设备领先一步,该设备已经与公共Oracle Cloud紧密集成。
何处是未来?
一些IT专家称存储业务正在垂死挣扎中,不过这并不完全正确。每天都有大量的数据产生,从数据保护和灾难恢复到全球高性能访问,再到永远在线可用性的每一个存储问题,都需要更加慎重的、以存储为中心的专业知识。
另一方面,许多IT人士可能更喜欢没有太多变化的世界,因为他们希望充分地维持现状。尽管如此,这些新方法可能会替代掉很多低级别的手动任务,从而节省时间和资源,进而企业能够更加注重增加业务价值。
新趋势将存储推向新领域,企业也需要跟上时代更灵活地定义存储空间。与IT一样,敏捷性至关重要。