超融合架构的本质之层次存储

存储 存储软件 超融合
现代计算机体系结构是基于冯·诺依曼体系结构构建的,冯.诺依曼体系结构将程序指令当做数据对待,程序和数据存储在相同的存储介质(内存)中,CPU通过系统总线从内存中加载程序指令和相应的数据,进行程序的执行。

本篇文章将进一步解释在超融合架构中,层次存储为什么是提升数据的I/O性能的***选择。

首先,让我们追溯到现代计算机体系结构中,解决系统性能瓶颈的关键策略:Cache。

现代计算机体系结构是基于冯·诺依曼体系结构构建的,冯.诺依曼体系结构将程序指令当做数据对待,程序和数据存储在相同的存储介质(内存)中,CPU通过系统总线从内存中加载程序指令和相应的数据,进行程序的执行。

[[223203]]

冯·诺依曼体系结构解决了计算机的可编程性问题,但是带来了一个缺点,因为程序指令和数据都需要从内存中载入,尽管CPU的速度很快,却被系统总线和内存速度的限制,不能快速的执行。为解决这个问题,Cache的理念被提出,通过在CPU和内存之间加入更快速的访问介质(CPU Cache),将CPU经常访问的指令和数据,放置到CPU Cache中,系统的整体执行速度大幅度提升。

I/O性能瓶颈问题转移到了存储

如果内存的访问速度相对CPU太慢,那么磁盘的I/O访问速度相对CPU来说就是“不能忍”了。下表是不同存储介质的访问延时,在虚拟化环境下或云环境下,由于I/O基本都是随机I/O,每次访问都需要近10ms的寻道延时,使得CPU基本处于“等待数据”的状态,这使得核心业务系统运转效率和核心应用的用户体验都变得很差,直观的感受就是业务系统和桌面应用“很卡”。

参考:http://norvig.com/21-days.html#answers

基于SSD构建平衡系统

和前人解决内存访问延时问题的思路类似,现在的主流方法是使用内存和SSD作为Cache来解决I/O性能瓶颈。存储系统能够分析出数据块的冷热程度,将经常访问的数据块缓存到内存和SSD中,从而加速访问。

不论是全闪存存储,还是混合介质存储,从某种意义上讲都是层次存储,只不过混合阵列多了一层磁盘介质。

学过计算机体系结构的人都听说过著名的Amdahl定律,这里我们要介绍一个Amdahl提出的“不那么著名”的经验法则:

在一个平衡的并行计算环境中,每1GHz的计算能力需要1Gbps的I/O速度与之匹配

假设一台服务器有2颗E5-4669 v3的CPU,每颗CPU有18个核,36个超线程,主频是2.1GHz,那么我们可以计算一下,这样的一台服务器需要151Gbps (即~19GBps)的带宽。在大规模的云计算(虚拟机算)环境中,极端情况下,大量的I/O并发使得存储收到的I/O都变成随机I/O,在这么一个并发环境中,假设我们的访问大部分都是8KB的读写,根据上面的计算,我们需要为一台服务器配备近250万的IOPS读取速度。

在不考虑系统总线的情况下,如果我们用SAS/SATA硬盘来提供这个IOPS,即使每个SAS/SATA盘可以提供近250的IOPS(实际数值更小),仅为构建一台平衡的服务器计算存储环境,就需要大概1万个SAS/SATA硬盘。在稍大规模的虚拟化环境,想要搭出一个平衡的系统,用传统的SAS/SATA硬盘几乎不可能完成任务。但是如果采用能够提10万“写IOPS”的SSD设备,25块SSD就够了。

层次存储的优势

“层次存储”是相对“全闪存”而言,是指将容量大但是速度较慢的HDD和速度快的SSD同时构建在系统中,通过数据的访问特性,将经常访问的热数据放置在SSD中,而冷数据放置在HDD中。

首先,为构建一个平衡的虚拟化环境,需要大量的SSD设备来提供足够的IOPS。但是SSD也不是***的。目前的SSD擦写次数有限、价格高。层次存储将热数据放置在SSD层中,而大量的冷数据仍然放置在SATA硬盘上,热数据周期性的同步到HDD硬盘,既为用户热数据提供了高IOPS的保障,也通过SATA硬盘提供了更大的容量和可靠性。

下图是对11个开发人员桌面负载的I/O统计,包含了对5.1TB大小的存储上的76亿次IO访问和28TB的数据传输。首先值得注意的是,有3.1TB(62%)的数据,在一年内从来没有被访问过,这意味着这些数据无论是放置在SSD上,还是SATA上,甚至放到U盘上拔走,对系统都没有影响。

图引自:《The 80/20 rule… for storage systems》by Andy Warfield

责任编辑:武晓燕 来源: SmartX超融合
相关推荐

2018-03-21 09:08:06

超融合架构本质

2015-08-19 10:18:53

存储虚拟化超融合架构

2017-10-18 13:31:56

存储超融合架构数据中心

2017-03-16 18:58:12

超融合存储站点

2015-09-11 10:38:47

超融合架构软件定义存储

2014-12-31 16:14:57

曙光超融合架构

2015-11-04 09:36:44

超融合IT基础架构

2015-08-28 10:01:30

OpenStack超融合虚拟化

2017-09-25 10:27:35

存储超融合软件

2018-03-22 12:09:05

HCISDS存储

2015-09-16 11:29:46

超融合架构软件定义存储

2020-04-09 09:49:50

架构IT存储

2019-12-02 09:41:05

存储数据IT

2018-09-29 18:07:21

AI 存储

2018-03-02 10:19:51

超融合架构传统IT架构

2016-02-24 10:50:34

2016-03-01 17:47:34

超融合存储

2018-03-08 15:30:31

超融合架构传统三层架构

2017-08-15 09:49:16

超融合软件定义存储

2016-12-06 20:01:00

超融合
点赞
收藏

51CTO技术栈公众号