随着互联网行业的飞速发展,各领域对数据存储及共享的需求与日俱增。据IDC公布的调查数据显示,未来全球数据将维持50%左右的增长率,到2020年全球数据总量将达到44ZB(十万亿亿字节)。那么问题来了——如此庞大的数据量该如何有效地存储利用呢?特别是在大数据及分析、动画制作、web服务和企业工作目录等业务场景下,需要搭建一套安全、便于扩容、高可靠、简单易用的文件共享存储系统。在此背景下,UCloud File System (UFS) 分布式文件存储应运而生。
三种存储形态的对比
目前,独立的存储形态主要有三种:块存储、文件存储以及对象存储。
块存储就是一块一块的硬盘直接挂载在主机上,主要操作对象是磁盘。从存储架构的角度区分,块存储又分为DAS存储(Direct-Attached Storage,直连式存储)和SAN存储(Storage Area Network,存储区域网络)。块存储一般不会定义磁盘的创建和删除操作,协议更注重传输控制。
文件存储,指的是基于文件系统上的存储,主要操作对象是文件和文件夹。我们知道,文件系统有文件夹,子文件夹,形成一个自上而下的文件结构;文件系统下的文件,用户可以通过操作系统中的应用程序进行读取、修改、保存等操作。从架构角度分析,文件存储提供一种NAS(Network Attached Storage,网络附属存储)架构,使得主机的文件系统不仅限于本地的文件系统,还可以连接基于局域网的共享文件系统。文件存储协议更注重接口的灵活以及访问权限控制。
对象存储是面向对象/文件的、海量的互联网存储,它也可以直接被称为“云存储”,主要操作对象是对象(Object)。对象尽管是文件但已被封装,因此在对象存储系统里,不能直接打开/修改文件,但可以像ftp一样上传下载文件等。和文件存储相比,没有目录树的概念,协议更注重简洁。
以下是对三种存储形态和存储架构的示意图:
在PC时代,用户的数据大多以文件的形式存在,数据共享也大多是以文件的形式访问,比如常见的的FTP服务、NFS服务、Samba共享都是属于典型的文件存储。几十个用户甚至上百用户的文件存储共享访问都可以用NAS存储加以解决。因此文件存储的广泛兼容性和易用性成为很多中小企业存储市场的不二选择。UCloud File System (UFS) 分布式文件存储是一种主要面向UCloud云主机提供简单、可扩展、高可靠的标准POSIX文件共享访问方式。在实现存储空间的在线灵活扩展的同时,也可实现多个计算节点访问同一个文件系统实例,极大提升了存储空间的使用效率,降低存储成本。
分布式文件存储UFS的三种应用场景
- 负载均衡服务下的数据共享
数据的存储效率和管理成本一直是困扰客户的问题之一。在负载均衡服务辅助下的多台云主机可以共享同一UFS文件空间。不仅极大优化了数据存储效率,也实现了数据存储层的高可用。
- 日志汇总存储及分析
随着业务规模的不断发展,云主机的日志数据如何管理成为日常运维遇到的重要议题之一。通过UFS文件共享服务,多台云主机上的日志数据可以实现快速的汇总存储及分析。有效降低日志分析与信息统计的时间与空间成本,显著提升运维效率。
- 企业个人文件存储
在企业中,不同的组织及用户所对应的职责和权限不同,用户可以使用的数据也不同,这给数据运维人员带来一定的运维复杂性。在为企业客户提供个人数据访问权限的同时,管理员可以通过指定目录和文件的属主及用户组,限制不同用户的访问权限方式,从而规范用户的使用行为,极大地促进企业数据管理的合规性。
UFS分布式文件存储架构解析
UFS存储整体架构如下:
- 接入集群:主要负责解析NFS协议并实现NFS语义。本模块还负责KV数据库模拟文件系统层级结构,与存储层交互完成数据读写定位。该模块为无状态设计,可平行拓展;
- 文件索引:文件系统元数据,包括目录索引与文件索引;
- 存储接入集群:此模块提供无状态的业务转发。
Set集群:Set为不受可用区限制的分布式存储集群。每个Set内部都由控制节点(Chunkmaster)与若干存储节点(Chunkserver)组成。其中Chunkmaster负责整个Set中的集群管理、路由、Chunk调度、发起迁移/修复操作等。Chunkserver负责最终的IO存取,管理对应Chunk迁移/修复等操作。
Set集群架构如下图:
UFS分布式文件存储四大特性
- 跨可用区共享挂载
UFS作为一个Region级别的产品,可以将一个UFS实例在多个跨可用区间共享挂载,达到文件在跨可用区的多台主机间共享的目的。
- 容量与弹性
可根据需求随时扩容,扩容过程中不会影响IO读写请求。相较传统的文件存储,UFS极易扩展能快速响应您的业务需求。同时,用户所需要管理的是适合业务需求的存储规模,极大地提升了存储效率,降低管理成本,优化IT架构。
- 安全可靠
UFS通过白名单访问机制限制实例访问权限,未在白名单内的云主机无法访问文件空间,极大提升了数据的安全性。同时,基于分布式的文件存储架构,支持3份冗余与强一致性,数据持久性可高达99.99999999%,是业务的可靠助手。
- 无缝集成
支持标准的NFS v3文件访问协议,提供标准POSIX文件系统语义,传统使用本地文件系统的应用程序可无缝迁移到UFS文件存储。
面对种类繁多的云存储产品,到底该如何选择?这是企业架构存储基础设施时不可避免的一个问题。这个问题不仅会影响企业前端业务场景,也会影响后端数据管理,其重要程度毋庸置疑。UFS分布式文件存储作为UCloud一款数据共享的重要产品,不仅在使用的灵活性和高效性实现了质的提升,同时注重高可用性和持久性,用户可以方便地将大数据及分析、Web服务和主目录等业务数据托管在UFS上,极大降低业务环境复杂度(UFS目前已经上线开始公测)。
Tips:
公测阶段目前支持区域:北京二
公测***申请容量20T。
目前只支持NFS v3协议,挂载只能通过TCP方式。