译者 | 朱先忠
审校 | 孙淑娟
引言
当今,管理数据存储的任务变得越来越复杂,以致于IT团队不得不与本地、直连存储、存储区域网络、网络连接存储和云存储卷等各种类型的存储问题展开各种极其复杂的斗争。
团队成员们可能正在部署超聚合系统,或者使用云存储技术的内部部署实现。而且,他们有可能在使用几种互不兼容的存储协议,尤其是对于非结构化数据方面。所有这些都是随着业务对数据的要求越来越高而发生的。
这促使人们对全局文件系统(Global File System:简称“GFS”,有时也称为“分布式文件系统”)越来越感兴趣。
其实,全局文件系统并不是一个新概念。早在20世纪80年代,卡内基梅隆大学就开发了Andrew文件系统(即AFS),目前仍在使用。从那时起,商业供应商就开始将这一概念进一步推广,并将其应用于云和内部部署存储。
不仅仅是对象存储
缩小内部部署和云存储之间的差距有望简化IT管理并降低成本。
本质上讲,云存储是分布式的。终端用户不知道或不需要知道他们的数据存储在哪里(除去任何基于法规约束性的限制外)。云供应商通过使用对象存储技术实现跨多个服务器甚至多个数据中心分割数据,从而支持企业规模经济发展需求。
但是,问题在于:大多数操作系统和应用程序无法直接读写对象存储。他们希望看到NFS或SMB这样的网络协议,或者直接访问或者通过SAN(Storage Area Network,存储区域网络)访问存储。尽管供应商们已经创建了存储网关,并且提供更多的应用程序与对象存储兼容(如Oracle和Openstack),但仍存在很多应用程序不兼容的情况。
因此,全局文件系统(GFS:Global File System)可能是目前解决上述矛盾的最佳答案,因为它能够提供云的灵活性、弹性和容量,同时还能够保持NAS(Network Attached Storage:网络附属存储)的简单性(至少对于应用程序和操作系统而言)。
IT产业研究机构Freeform Dynamics的首席分析师布莱恩·贝茨表示:“任何规模的大多数组织都会将数据存储在不同的位置和文件格式,这会使查找和使用变得非常困难。”“将全局文件系统置于首位意味着,所有具有访问权限的人都可以通过单一的标准格式看到您的所有数据;如果您愿意,可以使用虚拟化的‘超级文件系统’。”
这种方案的好处包括:基于云的规模经济性、优于通常通过内部部署系统实现的冗余、快速添加(或删除)存储容量的能力,以及从资本支出转向运营支出的支持等。
企业文件共享服务的其他优点还包括:更轻松的协作,更好的安全性,等等。
从未来发展看,公司有可能转向一个跨本地硬件(延迟和性能至关重要)和基于云的应用程序的单一文件系统。
全局文件系统的常见功能
首先,全局文件系统通过将中央文件服务(通常在公共或私有云上)与本地网络硬件相结合来进行缓存并确保应用程序兼容性。它们通过将所有存储放在同一个命名空间中来实现这一目标。这可以说是,所有数据的单一“黄金”拷贝。
同时,实现上述目标需要借助缓存和同步技术以确保性能。该领域的供应商之一CTRA表示,一家大型企业可能会在每个站点移动超过30TB的数据。
其次,系统需要广泛的兼容性。全局文件系统需要支持从传统的本地NAS(存储区域网络)硬件进行迁移。操作系统和应用程序需要能够像以前使用NFS或SMB一样轻松地访问全局文件系统。
最后,全局文件系统还需要确保易于使用。理想情况下,对最终用户透明并且能够扩展。当前的现实情况是,很少有公司能够同时将所有内容移动到一个新的文件系统;因此,一个能够随着应用程序的移动而增长的全局文件系统至关重要。
全局文件系统、传统文件系统及同步问题
作为一种基于云的服务,全局文件系统吸引了需要在站点之间共享信息的组织,或者在疫情期间经常支持的使用案例中与业务范围以外的用户共享信息的组织。
然而,这会导致全局文件系统的功能与传统的文件和同步服务之间的重叠。这些服务包括更加面向消费者的服务,如Dropbox和OneDrive,这些服务通常在新冠肺炎期间被投入服务以支持远程工作,还有SharePoint、Google Drive和企业级共享服务,等等。
一些全局文件系统供应商强调,他们也可以提供这些服务。当然,能够在外部共享文件或者将桌面搜索扩展到基于云的文件的话,这是很有用的。然而,对于大多数企业来说,基本性能、兼容性和易迁移性方面可能更是优先考虑的因素。
Freeform Dynamics公司的Betts说:“挑战是,这可能会导致存储规模变得非常大。例如,您的数据是全局分布式的,您(或您的全局文件系统开发人员)需要决定如何处理文件锁定(防止两个人或系统同时更新同一数据)和复制等问题。”
附:全球知名全局文件系统供应商列表
克特拉(CTERA)
位于以色列的云文件服务提供商克特拉(CTERA)公司通过Edge X系列产品、缓存文件管理器、CTERA驱动器、端点设备代理和虚拟工作区VDI的组合工作。其全局文件系统支持将客户文件链接到Amazon S3、Azure或IBM、HPE、Dell EMC和Scality提供的云服务。
克特拉声称,其缓存技术允许无限容量。此外,他们还提供来自Windows、Mac、Linux、Android和iOS的文件共享服务和设备级访问。
纳苏尼(Nasuni)
位于美国的云存储网关厂商Nasuni自称为“云原生(cloud native)”存储业务提供商,以其全局文件系统UniFS作为基础构建块。UniFS系统支持NAS和文件服务器整合、备份和恢复、灾难恢复和协作工具。
此外,Nasuni还支持全局文件锁定——两个用户不能同时写入一个文件,并为NFS和SMB服务以及重复数据消除提供边缘设备支持。或者,用户可以在其虚拟或超聚合基础架构上安装虚拟机来代替NAS硬件。Nasuni声称,部署其全局文件系统的公司不再需要单独的备份或灾难恢复。
潘祖拉(Panzura)
另一家位于美国的Panzura公司将他们的战略定位为:数据管理供应商和非结构化数据的单一平台。他们的核心全局文件系统是CloudFS,它创建了一个经过优化的单一数据集。该公司将CloudFS描述为一个全局性的混合云文件系统。
Panzura声称,这不仅取代了NAS硬件,还提供了数据管理和弹性存储。该服务还直接支持能够直接与云端同步的移动设备。另外,该公司还提供云块存储服务。
锤子空间(Hammerspace)
位于美国的Hammerspace公司则专注于为客户提供元数据的单一视图。他们声称,这样可以有效地存储和访问数据,甚至能够提前预测哪些数据需要移动。
Hammerspace打出的标语是,通过其提供的全局数据环境服务实现“本地访问全局数据”。基于此方案,可以将来自于云端、数据中心和边缘的数据汇集到一个数据集中。然后,全局数据环境提供访问以及辅助服务,包括数据分层、文件版本控制、重复数据消除、快照和防病毒。总之,他们的方案支持访问云、数据中心和旧式DAS、SAN和NAS文件存储,实现通过一个许可证涵盖所有形式的存储。
Peer软件
Peer软件公司提供的服务是具有混合和多云支持的全局文件服务,并支持边缘和数据中心。PeerGFS仅实现为软件层,支持主动-主动同步(active-active sync),它们使用微软DFSN支持的全局命名空间,并支持对象存储集成。PeerGFS还支持S3和Azure Blob。对等代理(Peer Agent)在Windows文件服务器或Windows虚拟机上运行,但用户保留对其数据的直接访问权限。此外,PeerGFS还支持云备份和复制。
译者介绍
朱先忠,51CTO社区编辑,51CTO专家博客、讲师,潍坊一所高校计算机教师,自由编程界老兵一枚。早期专注各种微软技术(编著成ASP.NET AJX、Cocos 2d-X相关三本技术图书),近十多年投身于开源世界(熟悉流行全栈Web开发技术),了解基于OneNet/AliOS+Arduino/ESP32/树莓派等物联网开发技术与Scala+Hadoop+Spark+Flink等大数据开发技术。
原文标题:Global file systems: Hybrid cloud and follow-the-sun access,作者:Stephen Pritchard