信息技术不断进步,全球数据量逐年递增。据IDC公布的调查数据显示,未来全球数据将维持50%左右的增长率,到2020年,全球数据总量将达到44ZB(十万亿亿字节),中国将达到8.6ZB,占全球的21%。在数据量快速增长的背景下,容易生出一个疑问:这么多的数据,究竟都被存放在何处?今天小编想跟大家分享一下存储这一块的变化。
过去的存储三大件,我归纳一下是三个东西。首先是购买一个SAN存储做数据库等业务;文件存储和共享一般会选择NAS;备份和归档一般会选择带库。现在很多传统的数据中心,基本还是这个存储三大件。
那么现代数据中心存储三大件是什么呢?我们先回过头来看一下企业CIO面临的挑战是什么,接下来再来看存储三大件。
首先,Gartner指出,现在是双活IT的时代,“模式一”强调传统应用稳定、可靠,“模式二”强调快速、敏捷。我们知道一个世界冠军既是百米冠军,又是马拉松冠军,现在好像还没有,一个产品同时满足这两种场景也是很难的。
IDC提到了我们现在说的第三平台。现在都是在从第二平台像第三平台转型,EMC创造了一个概念——2.5平台,这是一个转型平台。第二平台相当于Gartner说的模式一,第三平台对应的是模式二。目前,很多企业的投资都集中在第三平台上,而第二平台基本处于萎缩状态,但是依旧占了很大的比例。而存储在数据中心里面也比较重要,新的数字化转型要求IT务部门要去思考一些新的需求。所以说,我认为数据中心三大件是服务器、网络、存储,而存储应该是最重的。为什么?存储在整个数据中心里的投资也许不是***的,但是它确实最“重”的,因为硬盘很沉。当企业数据量不是太大的时候,你也许没有什么感觉。但是以后物联网的发展会越来越快,数据量也会膨胀的越来越快。据分析师预测,每年数据会翻一倍。此时你会发现,更换存储解决方案或存储厂商非常困难。因为在数据迁移时,保证业务不中断非常难。
第三平台
下面我们来看一下存储技术发展到了何种程度。IDC表示,企业存储技术正在面临闪存、软件定义、融合、云计算四大变革。如果我们还继续沿用过去的SAN、NAS、磁带库三大件,就不太符合现在的发展趋势了。再看Gartner的存储的成熟度曲线,我们看一下存储三大件和这里面的哪些技术有关系。首先,变革性的技术有三个,正好符合三大件。***个是固态阵列,被认为是***变革的技术。第二个是数据重删,他只是一项技术,被运用在不同的产品中。第三个是软件定义存储,先来看一个曲线图,在这个Gartner的曲线图当中,相比2015年有个很大的变化,它把软件定义分为两块。一个是管理系统软件定义,主要解决运维管理的问题,并不能真正解决“存”的问题。第二个是Infrastructure SDS,就是我常说的Server SAN,真正解决了“存”的问题。
第三个是什么呢?我们先继续看这张曲线图,每年的变化都会不同。2015年,这张上有个FCOE,今年消失了,那么就有两种可能性,出局或者技术成熟,他就是前者。
2016年存储技术成熟度曲线
刚才提到了全闪存,其实全闪存的发展比我们想象的要快很多。2016年9月的美国的闪存峰会,各个厂商都发布了全新的是硬盘。东芝要发布100TB的硬盘,其写寿命为一个颗粒可以被写9次,因此我判断这个硬盘会很便宜。其量产后,裸容量也许比硬盘每GB的成本还要低,可被用于归档和备份等。
现在我们可以看到闪存的拐点比想象的要快。原来全闪存阵列只能用在一些性能的场景,如虚拟机、VDI、数据库。现在全闪存的已经应用到一些通用场景,而且价格很低。备份归档,磁带库也许以后都不需要了。很多分析师都认为,2020年以后所有的生产数据都会放在闪存上。只有到了归档和备份阶段,才会放到其他介质上。
下面我们看一下Server SAN的发展。红色的部分是传统存储,趋势也在收窄。Server SAN也分两个方向。一个是企业用的,另外一个是互联网用的。互联网厂商很少购买存储,他们基本都在使用Server SAN。现在在企业里面还比较少,但是未来会是一个方向,因为他是一个变革的技术。
Server SAN是2014年年初提出的一个概念,它集合了闪存、软件、超大规模的优点,它代表了一个比较好的方向。很多时候我们认为使用Server SAN会很便宜,但实际应用中发现并不是这样。但是它的弹性非常好,扩容非常简单,响应时间快。比如业务部门对IT部门的要求是有很高的响应速度,你就需要考虑一个Server SAN的架构来满足他们的要求。
接下来我们要想想数字化转型的问题,数字化转型其实很重要,当你把企业的全部业务数字化以后,那么你对可靠性的要求就高了。EMC全球数据索引显示,11%的用户将双活用作数据的可用性手段。比如原来做一个备份就可以了,然而这种要求已经不能满足目前的需求了。现在很多企业都是互联网企业,要求业务24小时不能中断。我个人比较推崇还是阵列的双核。现在很多双活是由网关来做,然而网关都比较复杂,比如用EMC的双活,下面的高端存储使用华为SmatriX,上面用Vplex。从管理的角度来看比较复杂,因为它是属于两套东西。如果是阵列双活的话,硬件和软件的维护都是一套东西,管理起来比较方便。目前日立率先做了双活,华为、EMC也做了双核,EMC还做了网关双活和阵列双活两种模式。所以从高端存储方面来看,双活这部分我认为做得比较完善一些。
分析了这么多确实,我的观点其实已经很清楚了,我总结的现代数据中心存储必备的三大件是高端存储、全闪存阵列、全融合SDS。他们几乎完成了99%的需求。下面我为大家解释一下为什么必须是三大件。
高端存储到现在已经有25年历史,从1990年EMC的SmatriX推出来到现在历史超过25年。从Gartner报告看,高端存储8项能力的得分,华为比较晚做高端存储,评分也比较高。我们看到这个表里面,每个特性标杆基本上都超过4分,很少有3分,八大功能里面做得***基本都超过4分,基本是成熟的产品。
闪存阵列只有五年历史,刚开始是2010年***代厂商,Fusion-io、tms、Violin MEMORY在做闪存阵列,但是没有重删和压缩的功能。2012年,第二代全闪存阵列推出,增加了重删和压缩的功能,因此成本也降下来了。2014年,主流厂商纷纷推出全闪存阵列,可靠性方面也增强了,以及一些企业特性如加密、复制等功能。所以说我们看到看到Gartner对固态存储的这个评价,相对高端存储会有一些差距。***分只有3.9分,给了SolidFire。
所以说,对于我个人对于全闪存阵列的意见是,全闪存阵列很好,但是如果你的业务很关键,但是在搭建时还是使用高端存储比较好。如果你6个9的存储需求,建议你使用高端存储。如果是5个9的需求,可以考虑使用全闪存阵列。当然高端存储也可以考虑使用全闪存,其响应时间基本在1毫秒。如果采用全闪存,在重删和压缩全部打开的情况下,响应时间一般低于0.5毫秒。所以说时延还是不一样的。
我们看一下一般关键场景(OLTP场景),我们把高端存储和全闪存OLTP场景各个厂商的分数拿出来对比一下。高端存储的***分是4.16分,全闪存是3.73分。也就是说在关键应用的场景下,闪存还是有一些差距的。
接下来我说一下软件定义存储,现在很多厂商都选择开源厂商ceph,它的特点就是块、文件、对象基本都可以支持。企业中这三个需求都会有,如果是三套管理相对比较复杂。
下面我总结一下我的观点:
如果现代数据中心存储只让你选择三大件。我认为要把关键的应用筛选出来,第二平台的应用,如计费ERP还是要放到高端存储上,可以搭配全闪存和双活的安全应用。以及第三中心,保证它的可靠性,因为它有成熟数据服务,25年的历史,支持传统业务的稳定运行。但是,它的时延一般只能在1毫秒以下,而且一般不支持重删、压缩。所以针对第三平台应用,使用全闪存阵列就可以满足敏捷快速的要求。第三大件,就是统一资源池,采用SDS全融合云存储。便于管理,支持块、文件和对象接口,ZB级别规模,支持重删压缩,跨地域保护。
因此,我认为如果要建数据中心,我就会选择这三大件,90%的以上需求都会满足。当然如果希望做得更好,还可以选择管理性的SDS,实现自动化的运维。