一、传统存储系统的前世今生
1、一路走来的存储硬件
想要了解传统存储系统的前世今生,从存储设备开始是个不错的选择,关于存储硬件,常见的无非是硬盘,内存,固态硬盘,闪存等,硬盘和内存是相对出现比较早的存储介质。
早期的硬盘很庞大,单位面积存储数据量很有限,但是随着技术的发展,存储密度逐渐增加,而存储的成本却逐年下降。在早期,存储系统主要关注的点在于如何降低存储设备的造价,如何增加单位面积上的存储量。随着存储技术的提升,存储硬件的发展速度赶上了通信以及CPU的发展速度。存储关键技术有所转变,上层的存储管理系统所占整体存储系统的成本越来越大,对于存储介质本身,经过多年的发展,除了传统的HDD外,新兴存储介质在存储密度上逐年上升,单位存储价格逐年下降。在读写效率上,SSD随机读写效率要远高于HDD,RAM读写效率是这几种存储介质中***的,但RAM存在掉电丢数据的风险,在可靠性要求较高的系统中还是不能没有持久存储的设备。于是为了弥补RAM的缺陷,NVM出现了。新兴存储设备的出现,势必会影响上层存储系统的设计实现。
2、传统存储系统的开枝散叶
2.1 单机存储的步步为营
早期的存储设备是直接被CPU所控制的,这种方式存在诸多的问题,后来引进了额外的存储控制单元(control unit),CPU通过I/O指令来对硬盘进行控制,同时,控制单元还提供缓存机制,缓解CPU,内存,磁盘速度不匹配问题。随着数据规模的逐渐增加,人们对于存储的需求越来越大,单个磁盘的存储已经无法满足一些大数据场景的需求。后来出现了RAID,它有很多价格便宜的磁盘组成巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。这种方式不会对数据进行校验,对数据进行冗余备份,后来几乎所有的IT系统都需要进行容灾恢复,所以,对数据的备份显得尤为重要,这里RAID就提供RAID1级别,做基本的镜像备份,在不影响性能情况下***限度地保证系统的可靠性和可修复性。
2.2 网络存储的蓄势待发
随着网络技术的发展,局域网技术使的数据的传输代价较低,于是网络存储变成了大家的***,,后来在单机文件上衍生出了NFS,他可以让不同的文件之间共享文件系统。后来由此催生了一些经典的协议NFS,CIFS等。
3、传统存储的优缺点
一直以来,各企业公司政府事业单位信息化建设都是使用的传统存储,传统存储具有悠久的历史与成熟的技术,使用的场景丰富,实践经验丰富,另外,专用存储设备的厂商较多,从维护角度来说,有专门的人才***程度保证可靠性与稳定性。此外,传统存储具有较多的数据保护特性,适用范围广泛。并且部署起来比较简单,组网逻辑简单。
同样的,传统存储的成本较高,需要购买专门的硬件,专门的License,专用的线缆,专用的交换机,专门的板卡,专门的多路径软件。在维护上,虽然有了专门的人才,较多的数据保护特性,但是,由于厂商较多(既是优点也是缺点),也导致了在多厂商异构组网的时候难于维护。
二、分布式存储系统的应运而生
互联网规模越来越大,并发请求越来越高,传统的数据库并不能很好的满足各种场景,于是分布式储存系统应运而生。
1、分布式相比于传统存储系统的优点
①高性能
他通常可以高效地管理读缓存和写缓存,支持自动的分布式存储通过将热点区域2映射到高速缓存,提高响应速度。一旦不在是热点,那么存储系统将会把他们移除。写缓存技术可配合高速存储明显改变整体存储的性能,按照一定的策略先将数据写入高速存储,再在适当的时间进行同步落盘。
②支持分布式存储
通过网络进行松耦合链接,允许高速村塾和低速存储分开部署。一定条件下分层存储的优势可以发挥到***。解决了***的问题是当性能池读不***后,从冷池提取数据的粒度太大,导致延迟高,从而给造成整体的性能的抖动的问题。
③多副本一致性
他相比传统的存储框架使用RAID不同。它采用了多分本备份机制,存储之前进行分片,之后按照一定的规则存在集群的节点上,为了保证数据一致性,布式存储通常采用的是一个副本写入,多个副本读取的强一致性技术,读取数据失败,从其他副本获取,重新写入该副本恢复。
④容灾与备份
对于容灾采用最重要的手段就是快照,可以实现一定时间下的数据的保存。他有利于故障重现,有助于分析研究,避免灾难,备份就是为了数据的安全性。
⑤弹性扩展
分布式存储可预估并且弹性扩展计算、存储容量和性能,节点扩展后,旧数据自动迁移到新节点上,实现负载均衡,避免单点问题。水平扩展只需要将节点和原来的集群链接到同一网络,整个过程不会对业务造成影响,当加节点时,集群系统的容量和性能随之线性扩展,。新节点资源会被平台接管,呗分配或吸收。
⑥存储系统标准化
随着分布式存储的发展,存储行业的标准化进程也不断推进,分布式存储优先采用行业标准接口(SMI-S或OpenStack Cinder)进行存储接入,在平台层面,通过将异构存储资源进行抽象化,将传统的存储设备级的操作封装成面向存储资源的操作,从而简化异构存储基础架构的操作,以实现存储资源的集中管理,并能够自动执行创建、变更、回收等整个存储生命周期流程。基于异构存储整合的功能,用户可以实现跨不同品牌、介质地实现容灾,如用中低端阵列为高端阵列容灾,用不同磁盘阵列为闪存阵列容灾等等,从侧面降低了存储采购和管理成本。
2、分布式相比于传统存储系统的缺点
首先,从部署与维护的角度来看,分布式存储部署过程较为复杂,需要专门的人才进行部署,维护与管理,需要一定的时间培养专门的人才。其次,从硬件设备角度来看,分布式存储使用的均为X86架构服务器,稳定性可能不如传统的硬件存储。尤其对于银行,金融,政府等重要行业,稳定永远大于一切,他们既是新技术的实践者但同时也需要最稳定的环境保持业务的良好运行。***,对于数据保护技术,大部分都是通过副本技术实现数据保护机制,常见的有两副本三副本等,这样也会造成可用存储容量的降低。
三、总结
现在我们可以回答文章开头提出的“分布式储存系统那么牛逼,是不是传统存储系统就一无是处呢?”这个问题了。分布式存储系统的诞生,与传统存储的最终目的都是一样的,就是如何有效的利用好存储,并降低维护成本。分布式存储系统的产生也是对于传统存储系统缺点的补充,是在传统存储系统的基础上的改进,我们也期待分布式存储系统的发展,能够更好的降低维护的人力物资成本,实现存储资源的有效利用,实现数据的有效保护!