去年5月份,华为正式推出其***一代融合存储OceanStor V3系列产品,自上市以来,该融合存储产品就获得了大量关注,凭借其五大融合特性成为业界的焦点,并且短时间内获得了巨大的市场成功,在金融、政府、媒资、能源、制造等诸多行业得到广泛部署和使用。近日,华为又宣布其OceanStor 5500 V3产品在SPC-1测试中获得了10万IOPS性能测试成绩,取得如此出色成绩背后离不开其在硬件架构、软件功能以及优化算法方面强大特性,OceanStor 5500 V3也一举将当前中小企业市场的存储水准提升到新的高度。
5500 V3:SPC-1性能测试突破10万 IOPS
存储性能是衡量存储系统优劣的一个重要指标,它直接决定了存储系统处理业务的能力。在存储业界中,存储性能委员会(Storage Performance Council,简称SPC)的SPC-1和SPC-2两大SAN性能基准测试被广大厂商和用户所认可,其对外公布的客观、权威、公正的性能数据是客户采购的重要参考数据。华为OceanStor 5500 V3在本次SPC-1测试中取得了10万IOPS的性能,创造了中端存储在性能方面的新记录。
根据华为介绍,本次测试的产品是华为OceanStor 5500V3,配置为双控制器,384块2.5寸10K的SAS磁盘,每个控制器拥有48Gb内存,在整个SPC-1存储测试中并未使用到SSD,最终5500 V3获得了SPC的10万IOPS和时延为7.82ms的性能认证。SPC主席Walter先生现场见证和检验了华为OceanStor 5500V3的测试环境与测试结果。
华为存储专家表示:“SPC-1测试主要针对随机小IO快速响应的应用场景,主要用来度量SAN阵列在OLTP、Database以及Email三种应用场景下的性能表现。”SPC-1作为SPC基准组织制定的、全球权威、业界广泛认可的SAN性能测试基准,对存储系统的IOPS性能进行认证,并且要求时延小于30ms。“SPC基准测试能够牵引厂商产品性能提升,并且对产品设计和开发规范化有一定参考作用,同时还是提升产品竞争力和品牌影响力的良好途径,也是用户在竞标过程中重要的参考因素。”
毫无疑问,华为OceanStor 5500 V3存储产品突破10万IOPS的性能测试结果意味着中端存储开始买入到新的水准高度,这背后离不开华为在OceanStor V3系列存储的硬件架构、软件功能以及优化算法等方面做出的突破性创新。
出色的硬件架构
众所周知,衡量一款存储系统的优劣有很大一部分因素在于其硬件架构,这点在过去的高端存储领域显得尤为明显。而和以往不同的是,硬件架构也开始对中端存储产品产生决定性的影响,过去传统基于纵向扩展的双控硬件架构的存储系统已经在市场中逐渐失去活力和用户的青睐。尤其是在中端存储领域,具有横向扩展能力、灵活的硬件架构已经成为中端存储的发展趋势,而华为OceanStor 5500 V3就是具有一款横向扩展能力的典型产品,其在硬件架构层面上的创新打破了过去中端存储固定在双控模式上的思路。
图一:华为OceanStor V3系列存储拥有出色的硬件架构。
华为OceanStor V3融合存储是具有灵活扩展特性的存储系统,采用了IP互联架构设计,存储引擎间通过10Gb以太网交换机进行业务数据交换和镜像通道。据悉,华为OceanStor V3融合存储***支持4个引擎,每个引擎包括两个控制器,控制器之间采用PCI-E 3.0背板互联设计,由8通道PCI-E 3.0组成双控之间的高速镜像通道。
图二:华为OceanStor V3双控之间采用PCI-E 3.0高速互联。
华为OceanStor V3系列融合存储在集群模式下组网具有两种方式,即交换组网和直连组网。在交换组网的模式下,多个V3控制框之间通过10Gb以太网连接两个冗余的数据交换机Data Switch进行数据交换,这种模式最多可支持4个引擎,即八个控制器,像这种IP Scale-Out的扩展方式基于优化的iWARP协议,可直接采用RDMA技术解决以太网延迟高的问题,同时释放CPU资源;而直连组网模式则是一个网卡上两个网口分别连接到另一个引擎的控制器,这种模式最多可支持2个引擎,即4个控制器。
图三:华为OceanStor V3多控组网方式,最多可扩展到八个控制器,像OceanStor 5500 V3这样的中端存储能够做到多控扩展,的确是给中端存储带来了革命性的变化。
除此之外,华为OceanStor 5500 V3能够在只用传统SAS磁盘、不用SSD的情况下实现10万IOPS的突破也跟其采用了***一代存储硬件密不可分。华为统一存储产品专家董浩表示:“OceanStor V3采用了领先一代的存储硬件,包括英特尔***一代的六核处理器、内部采用PCI-E 3.0总线、12Gb的SAS硬盘接口等。此外,自研的智能接口卡实现了协议和业务处理的硬件卸载,减少IO对控制器CPU消耗,有效地提升了存储系统的性能。”
功能强大的软件架构体系
事实上,对于存储系统而言,在经历了一个硬件比拼的时代后,早已步入到软件决定竞争成败的新时代。过去中端存储往往是简单比较容量、性能等参数指标,而随着越来越多高端存储软件功能下移,中端存储系统在软件架构以及软件功能方面的竞争力显得异常重要。当前市场上很多传统的中端存储系统在软件层面存在着历史包袱过重,软件架构和功能简单堆叠等突出问题,直接后果就是软件堆栈过于复杂,严重影响了存储系统的整体性能和用户体验。华为OceanStor V3通过统一的存储操作系统OceanStor OS进行构建,包括存储系统端软件、维护终端软件和应用服务器端软件,这三部分软件紧密配合,从在软件层***限度发挥存储系统的性能与效率。
图四:华为OceanStor V3软件架构示意图。
在基于OceanStor OS的统一操作系统下,华为的一些软件功能架构充分实现了性能的关键性突破。比如RAID 2.0+软件架构,与OceanStor V3存储系统可谓是天然结合,彻底改变了过去传统中低端存储的RAID方式,极大提升了数据存储和重构的速度。
图五:华为OceanStor RAID 2.0+块虚拟化技术。
OceanStor V3通过RAID 2.0+块虚拟化技术将存储系统中每一块硬盘都进行细颗粒度的数据块切分,然后通过细颗粒的数据块构建各种RAID组,这种分布式、打散化的方式能够让数据均匀分布到存储池的所有硬盘上,大幅提升了存储资源的管理效率。在数据重构方面,众所周知,传统硬盘重构的瓶颈主要是在热备盘,所有成员盘将所有数据读出之后全部写入到热备盘,这种方式决定于热备盘的写带宽速度,犹豫机械硬盘的物理限制,这种多对一的重构存在热点、重构时间长等缺点。而OceanStor V3的RAID 2.0+技术则是分布式、均匀负载的数据存储方式,所有在数据重构之时,也是多对多的重构,大幅缩短数据重构时间(1T数据重构仅30分钟,为业界普遍10小时的20倍速度)。
图六:OceanStor的Cache分层设计,大幅提升Cache存取效率。
华为OceanStor的Cache分层设计让一层Cache靠近主机应用侧,用于缓存用户热点数据并感知应用,从而提供灵活的预取策略;二层Cache额靠近盘端,提供元数据和数据缓存,实现写数据的聚合及排序,保证高效的系统刷盘。此外,像SmartPartition缓存优化技术可以通过对系统核心资源的分区,保证关键应用的性能。管理员可以针对不同的应用配置不同大小的缓存分区,系统将保证该分区中的缓存资源被该应用独占,并根据业务实际情况实时动态调配不同分区中的前后端并发,从而保证位于该分区的应用性能。SmartTier自动分级技术则能够帮助用户在合适时间将合适数据放置在合适的存储介质上,可以设置为高、中、低三个档次的迁移速度,很好地满足用户在分级方面的存储需求。
这些仅仅是华为OceanStor OS操作系统中的部分软件功能,在出色的硬件架构基础上,华为存储强大的软件架构和功能能够让硬件更加充分的发挥性能优势。像华为OceanStor 5500 V3这样的中低端存储产品同样拥有强大的软件架构体系和功能,突破10万IOPS的记录也就“不足为奇”了。
核心优化算法:精、准、快
与过去采用非标准化的硬件不同,存储系统在几年前就开始迈入X86标准化硬件的时代,英特尔多核处理器成为存储系统控制器中的***。自此,存储系统也进入了多核时代,针对英特尔多核处理器优化也必然成为存储系统发展的趋势。从市场上看,主流存储厂商无一例外都非常看重针对英特尔多核处理器的优化工作,因为存储系统的硬件更新带来了高性能,但是没有优秀的算法和优化技术,高性能并不意味着能够做到低延迟,延迟如果过高,同样将严重影响到存储系统的整体性能和效率,几乎等同于在浪费性能出色的硬件资源。华为OceanStor V3系列存储格外重视对英特尔多核处理器的优化,在并行处理、高效内存访问、负载均衡等方面进行了全面的优化,实现了核心优化算法的精、准、快。像OceanStor 5500 V3能够在10万IOPS的性能情况下将时延控制在8ms以内,华为的核心优化算法可谓是功不可没。
“英特尔CPU发展趋势就是多核多线程,因此程序设计就面临着任务调度均衡问题,程序并行度,CPU Cache失效等问题,这需要存储系统在关键算法方面提升并行处理能力、硬件处理能力以及内存访问效率。”董浩表示道。
图七:华为OceanStor V3采用的高性能IO调度算法。
华为的IO调度算法在统一的IO调度框架中,让每个调度线程绑定固定的CPU核心,减少CPU之前切换带来的延迟影响,降低线程调度开销,实现高效内存的访问和核间动态负载均衡,独特的IO流程异步化及免锁设计保证了多核效率及系统的高可扩展性。资源控制算法通过每个LUN可使用Cache的额度管理、并发和CPU调度管控,降低性能波动,保证IO均衡平稳运行。
图八:华为OceanStor V3的Cache优化算法。
总体而言,华为OceanStor 5500 V3作为一款具有时代精神的中端存储产品,在硬件架构、软件架构与功能、核心优化算法等方面都具有开创性的创新,在不使用SSD的情况下突破10万IOPS、达到低于8ms的性能表现其实是有其背后深厚的技术实力作为支撑。与高大上的高端存储局限在某些领域不同,中端存储面对着广泛的市场用户群,华为OceanStor 5500 V3将中端存储的水准提升到新的高度,必然引起一场中小企业存储市场发展的新变革风潮,最终也将惠及到广大用户。