深入DellWorld2015:SC9000存储软硬件更新解密

存储 存储软件
软件定义的存储(SDS)是当前火热的名词,不知大家是否记得早在数年前就有传统磁盘阵列厂商提出“存储即软件”的说法?

软件定义的存储(SDS)是当前火热的名词,不知大家是否记得早在数年前就有传统磁盘阵列厂商提出“存储即软件”的说法?

如今的软件定义存储,无论是像VSAN、Ceph这样的分布式架构,还是Nexenta ZFS这种单/双控集群架构,更多意义上强调的是软硬件解耦。而传统企业级集中式存储,虽然仍是软硬一体销售的模式,但核心硬件组件——包括CPU等也早已趋于同质化。因此阵列的操作系统,或者说Firmware就像是它们的大脑,直接反映出不同品牌/系列的差异化,也是核心价值所在。

对于存储阵列产品的升级,软硬件不一定完全同步。硬件平台升级,基本上会带来性能、扩展性的提高;而软件升级则可以增加/完善更多的功能、修复bug等。

这一次,戴尔SC(Compellent)阵列的SCOS 6.7操作系统升级走在了硬件前面一点,而当Dell World 2015上正式推出新一代高端产品SC9000,则给我们带来了更大的惊喜!

 

Dell Storage SC9000

①控制器硬件换代,CPU由每控制器2个6核升级为2个8核,同时提高主频;②内存增大4倍,由最大128GB提高到512GB(双控制器);③后端驱动器接口由6Gb/s SAS升级到12Gb/s,增加支持SC400(2U 12x3.5”)和SC420(2U 24x2.5”)两款12Gb/s SAS扩展机箱;④最大IOPS提高40%,带宽增加110%。

如果说硬件更新是驱动性能提升的主要因素,软件优化和新增的强大功能则离不开系统软件的升级。下面我们就来深入解读Storage Center 6.7的更新:

1、全新高端型号控制器(SC9000)、扩展柜支持2、针对SC8000/SC4020的更新带有自动切换(Auto-Failover)的Live Volume增强型压缩从PS系列精简导入(Thin Import)针对Oracle的应用保护管理器(APM)

Live Volume让容灾切换更加自动简单

使用Dell Storage SC系列Always Live Volume的VMware Metro Cluster远程跨站点集群,图片引用自《ESG Lab Review - Always Available Dell Storage SC Series》

 

这个是戴尔Live Volume架构示意图。最新的Storage Center 6.7能使Compellent更好地支持双活和两地三中心的切换,并通过VMwrae相关认证。

同时我们也想补充提醒一下大家,支持自动切换不代表该功能就适合所有场景,许多时候还是需要人工干预。什么情况下应该切?会不会误切?这已经不只是技术范畴,而是管理者要思考的问题了。

戴尔Live Volume已经通过VMware vMSC(vSphere Metro Storage Cluster)的认证,也就是可以接近于在本地数据中心的一套阵列上那样进行虚拟机的HA切换、vMotion迁移等操作。

关于同步复制/双活对网络带宽和延时的要求,比如有的公司宣传其存储双活用于VMware集群可以支持300km距离,戴尔也一样能实现。因为光速(光纤延时)对大家都是平等的,而实际线路质量则参差不齐,所以还有传输设备等其它需要关注的因素。比如我们建议同步复制的延时不超过5ms、40km以内,是为了减少对实际应用和性能带来的影响。

独特闪存数据缩减技术如何做到性能不下降?在Storage Center 6.5-6.6版本,戴尔已经引入了针对分层存储的最底层不活跃数据的压缩功能,可以有效节约“冷数据”占用的磁盘空间。

Storage Center 6.7的变化如上图所示:除了全HDD阵列和混合阵列配置之外,在单层、RI(读密集型)/ WI(写密集型)SSD分层全闪存阵列上,也可以打开压缩功能——如上图绿色的“单层AFA”和“T2 RI SSDs”部分。

 

为什么戴尔宣称这个“增强型压缩”能够保持最大性能呢?我们认为该技术仍然遵循着久经考验、广受好评的Data Progression自动分层存储的一贯原则。

永远写入高性能分层迁移后数据的读性能不因为闪存类型和RAID级别而下降1.在单层AFA上,原始数据按照RAID 10写入,待生成Replay快照冻结数据块之后,RAID分层将其转换为RAID 5/6并同时完成压缩。所有后续写入仍然以RAID 10方式,而RAID 5/6的读性能不低于RAID 10。

注:之前有存储厂商的实时压缩技术号称“不影响读性能”,言下之意就是写性能还是有影响的。当然这个也与数据类型有关,不排除特殊数据样本下(比如接近全0或者全1)压缩后实际写入量很少反而更快的情况。

2.在闪存分层的配置下,原始数据按照RAID 10写入WI SSD分层,待生成Replay快照冻结数据块之后,Data Progression将其迁移至RAID 5/6的RI SSD分层并同时完成压缩。所有后续写入仍然以RAID 10方式进入写密集型SSD,而读密集型MLC/TLC SSD的读性能可达SLC/高耐久度eMLC水平,RAID 5/6的读性能也不低于RAID 10。

戴尔SC阵列的增强型压缩,通过与自动分层存储相结合,其压缩动作成为定期执行的后台任务,从而有效避免了对写入性能的影响。同时,在不额外添加专用硬件的情况下,高效压缩算法保证了读性能不下降。

可能有人会问单层AFA中的RAID 10部分,以及T1 WI SSD中的数据得不到压缩怎么办?我们应该注意到,这些数据在整套阵列中所占的比例是较小的。得益于戴尔SC系列的软件架构设计,它们通常只需要容纳一天~几天写入的数据量即可,所以我们不用担心整体的压缩效果。

上图引用自白皮书《Dell Storage Center SCOS 6.7 and Data Compression》,均按照60%压缩比来计算

 

如上图示例,在SCOS 6.7版本之前,对橙色部分“冻结的不可访问数据页”(不包括卷最新状态中的数据,只被历史Replay快照引用)的压缩回收了6GB空间;而SCOS 6.7新加入对“冻结的可访问数据页”(只读Replay快照数据)压缩回收了12GB空间;允许写入的“活动数据页”不适合数据压缩。这样整体节约的容量就是51%。

关于戴尔Data Progression自动分层存储的原理,包括上述不同数据分层的定义及管理策略等,可以参考冬瓜哥大作《存储极客 | 浅析固态介质在存储系统中的应用方式》。

与PS系列软件融合精简导入互连互通所谓Thin Import,是指在戴尔PS(EqualLogic)阵列上的thin-provisioning精简配置卷,能够保持“瘦身”状态导入(迁移)到SC系列上。只需要拷贝实际写入过的数据块,而不是前端主机看到的整个LUN容量。导入到SC阵列之后的卷仍然保持精简格式。

这种精简导入,建立在戴尔自主知识产权的产品系列间部分代码复用的基础上。戴尔在SC、PS等自己的品牌系列不仅拥有完整的自主知识产权,而且还有着自主研发的能力实现产品系列的数据整合。

快照管理器为Oracle数据库保驾护航在Storage Center 6.7之前,戴尔SC系列的Replay快照已经能够与Windows平台下的SQL Server、Exchange Server、Hyper-V以及VMware Hypervisor配合,实现具备应用数据一致性的快照,有效改善了恢复效果。针对Oracle,可以通过编写脚本在快照创建之前通知数据库将内存中的“脏数据”写盘,并且有过一些成功实施的项目。

那么我们来看一下新版软件的变化:APM for Oracle允许Oracle管理员在没有存储或者数据库管理员帮助的情况下,保护和恢复他们的数据;APM包含在Enterprise Manager 2015R2管理软件中;提供Windows客户端和Linux代理。

这方面也有点类似于Live Volume的自动切换,都是把自动化功能集成到图形管理界面,让存储生成Oracle数据库一致性快照的配置操作更加简单易用。而这些也正是商业存储与开源软件定义存储的差别体现,只有真正成熟、稳定的才能称之为产品,而不是在部署和运维上需要大量踩坑的项目。

展望未来值得期待据了解,在戴尔存储未来的Roadmap上已经规划了SC家族的一系列软硬件更新。我们相信,本次发布的SC9000有实力延续Compellent的辉煌!

 

责任编辑:老门
相关推荐

2015-10-28 15:27:59

戴尔存储

2015-10-25 15:11:49

Dell

2009-12-31 08:59:58

Windows 7认证列表

2010-01-11 10:25:08

Linux软硬件配置

2015-11-12 10:42:12

2015-10-25 15:21:47

Dell

2010-04-23 10:30:16

实现负载均衡

2012-06-19 10:34:36

微软surface平板

2015-08-19 10:25:35

格力董明珠手机

2011-03-09 09:33:51

Stack Overf架构

2017-08-14 13:40:34

VDI软硬件IT

2021-01-14 08:00:00

服务器数据中心DokuWiki

2010-05-12 15:11:18

华夏擎工作组LOGO有奖征集

2010-08-24 10:47:58

2012-05-29 09:20:11

微软鼠标

2009-12-23 09:37:38

集线器故障

2010-09-26 15:47:04

Oracle

2012-07-18 17:06:36

Gartner云计算

2012-05-14 11:40:42

ARMWin8Intel

2020-03-02 19:51:40

戴尔
点赞
收藏

51CTO技术栈公众号