非结构化内容正在快速增长,并在新数据中处于领先地位。
通常来说,以非结构化格式创建的信息会作为对象储存在对象存储中,或者作为文件储存在网络附加存储(NAS)中。
这也使得NAS的生态系统不断发展,同时,新产品和解决方案不断涌现以满足混合基础设施(例如云计算NAS)的需求。
NAS基础知识
作为一个平台,NAS(使用NFS和SMB协议)提供了我们在块或者对象系统中看不到的结构和元数据。
块设备本质上是“原始”存储,并且需要前面有文件系统。
对象存储非常适合大规模“二进制”数据存储,但通常将文件分组到大型数据池或者存储桶,而没有任何层次结构。对象存储还有一个基本的存储/检索机制,其中整个对象被写入(PUT)或者读取(GET)。
而NAS提供更多功能,例如基于文件的锁定、分层目录结构以及部分读取和写入文件内容的功能。
因此,文件存储是跨地域或者在公共云和私有云之间共享数据的***解决方案–以云计算NAS的形式。
云计算NAS的优势
云计算NAS解决方案可提供比传统NAS更多的优势。
例如,IT企业可通过选择基于SaaS的解决方案移除管理功能。
同时,采用单一命名空间的平台可提供几乎***的扩展,特别是在使用公共云作为后备存储时。
而且,通过云计算NAS,企业可以转向基于opex的模型(根据使用情况来收费),而不是花资金来部署硬件—这对于全球分布企业可能利用率很低。
云计算NAS用例
随着NAS市场从基于本地的文件管理器发展为云端解决方案,我们看到四个不同类别出现:
公共云SaaS:这些解决方案是基于公共云,其中一些解决方案提供对本地存储的访问和整合。这里的例子包括Nasuni、NetApp Cloud Volumes和Zadara。公共云是这些解决方案的后备存储,数据可通过公共云或者本地缓存设备来访问。
云计算IaaS:这些解决方案部署NAS作为基础设施服务,可部署在私有本地云内、通过托管服务提供商或者使用某些公共云基础设施的混合模式。这与SaaS产品的区别在于客户直接管理基础设施,例子包括CTERA和Panzura。
云计算市场:此类别涵盖可通过公共云市场部署的解决方案。供应商封装这些解决方案以在虚拟实例运行,按小时收费或者按容量许可方案收费。在某些情况下,这些解决方案可能与本地基础设施整合,正如Avere Systems vFXT那样。
软件定义混合模式:这些解决方案是可在本地或公共云运行的混合产品。在很多情况下,这些产品可整合内部或者外部数据,这里的解决方案包括Elastifile、Wekalo Matrix和Qumulo QF2。
替换基于文件的存储
这些解决方案最明显的用例是取代传统基于文件的存储(用于主目录和共享数据)。在全球企业中,共享数据可能非常耗时,并且,可能导致相同信息出现很多不一致的副本。通过全球命名空间,云计算NAS可使文件内容的部署和管理变得更加容易。
另一个用例是对NAS平台存储的数据执行分析的能力。混合解决方案将数据访问扩展到公共云,而谷歌(Cloud Platform)和亚马逊云计算服务等提供的分析服务可通过云端工具执行内容分析。
第三个用例是构建云计算NAS作为备份解决方案,大多数备份产品提供NAS作为存储目标。这让分支机构的备份可集中和/或恢复到其他位置,从而提供某种形式的灾难恢复功能。
云计算NAS供应商和产品
NetApp最近在预览版本中推出了Cloud Volumes。在微软Azure和谷歌Cloud Platform中,文件存储都在本地整合为SaaS解决方案。在亚马逊云服务中,Cloud Volumes在虚拟实例内运行,这些实例可从AWS Marketplace购买。Cloud Volumes的底层技术是NetApp ONTAP存储操作系统的云端部署。这意味着Cloud Volumes可提供快照等现有数据服务,并可提供比现有公共云NAS更高的性能。
CTERA Networks提供名为CTERA Enterprise File Services Platform的解决方案,该解决方案提供一个全局分布式平台来存储和共享文件内容。端点访问是通过桌面客户端软件(CTERA Drive)或者边缘网管/文件管理器实现。CTERA的后台存储是对象存储,可部署在企业内部或者基于公共云。CTERA的典型用例是替换现有文件共享和主目录,并作为全局备份目标。
Avere Systems vFXT是一款虚拟边缘文件管理器,可在AWS或者GCP运行,在微软收购Avere公司后将可能可在Azure运行。该解决方案可作为虚拟实例运行,并将本地数据扩展到公共云,从而允许内容暴露给本地云服务(例如分析)。使用vFXT的主要好处是能够让数据在公共云可见,而不需要传输数据集的全部内容。并且,应用可从低延迟本地缓存数据中获益,同时数据传输成本可降至***。
Nasuni Enterprise File Services(NEFS)是基于公共云的全球NAS平台。该解决方案可用于主存储、归档或者备份。NEFS的标准后备存储是公共云对象存储,由Nasuni直接管理。客户无法查看或者访问云账号。而NEFS可使用私有对象存储。其中,端点访问通过企业内部物理或虚拟边缘设备实现,NEFS提供全局文件共享和锁定,并配有***边缘文件管理器—具体取决于所选的许可模式。
WekaIO Matrix是横向扩展分布式文件系统,被设计为在NVMe存储运行,并可以非常低的延迟提供高性能。Matrix是作为软件定义存储解决方案交付,它也可在公共云的虚拟实例中运行。非活动数据也可分层到对象存储(支持AWS S3或者Swift协议)。Matrix的典型用例是那些需要低延迟的应用,特别是对于小型文件,例如AI/机器学习分析,或者媒体和娱乐等高吞吐量工作负载。
Elastifile Cloud File Systems(ECFS)是一种横向扩展软件定义存储文件系统产品,它可在本地、公共云或者两者混合运行。典型的部署模式包括专用存储(其中设备作为存储阵列)或者超融合存储,即将计算和存储混合在同一节点。ECFS被设计为在异构配置运行,并且最近的更新让它可轻松地在谷歌Cloud Platform部署。
Qumulo QF2(Qumulo File Fabric)是软件定义横向扩展文件系统,可作为虚拟实例部署、在裸机硬件或者在公共云中部署。QF2被设计为在单节点配置中具有高度可扩展性,其中B树索引用于管理文件和数据结构。多个群集可在很多位置之间复制文件系统,以便将数据移入和移出公共云。QF2也可从AWS Marketplace获取。
Panzura CloudFS是一种横向扩展NAS解决方案,它使用公共云或者私有云作为集中备份存储。边缘文件管理器可以是物理设备、虚拟机或者云实例,并提供对全局可用内容的本地访问。CloudFS作为单个命名空间部署,它可将全局锁定扩展到单个文件的字节范围。这允许并发访问,即使在很远的地理距离。
总结
***,我们不应该忘记的是,对象存储供应商还可以在他们的平台提供文件支持。到目前为止,我们已经看到SwiftStack、Ceph、Cloudian、Scality和Caringo的部署。这带来横向扩展能力,并在某些情况下,还带来从任一协议访问内容的能力。未来我们可能会看到这两种数据类型的合并,这两种访问方法是非结构化数据解决方案的关键。