6月18日,在德国法兰克福举行的国际超算大会(ISC2019)上,组织者公布了***一期的IO500存储系统性能排名(https://www.vi4io.org/io500/list/19-06/10node),焱融云成为中国初创企业中唯一入选榜单的公司,在全球的Storage Vendor(存储供应商)中排名第八,比肩DDN、Dell EMC、WekaIO、IBM、NetApp、浪潮等一线厂商。
IO500
高性能计算领域,基础架构设施由超级计算机及高性能存储及网络组成。在每年的国际超算大会(ISC)上,公布超级计算机的性能排名,即近日大家热议的Top500榜单。同样地,在ISC大会上还会公布IO500榜单,IO500是针对存储系统性能的排名表。这两个榜单,标志着相关研究机构及企业,在高性能计算和存储领域的技术实力和产品水平。
高性能存储系统的基准性能测试是一项复杂的任务,并行I/O不仅受CPU延迟性能和网络的影响,还受底层存储技术和软件的影响。不同厂商发布的性能测试结果,往往由于测试方法、工具、参数甚至测试步骤的先后顺序不同,而具有较大的差异性。IO500定义了一个全面的基准性能测试套件,可以对高性能存储系统进行标准的测试和比较,旨在为用户提供一个标准的评价依据。
与计算体系结构的Top500列表类似,IO500不仅提供评价存储系统性能的关键指标,还将作为在业界促进和共享***实践的资料库。
从测试方法上,IO500进行两组测试,分别完成以下场景的测试:
理想状况下,存储系统的***性能(例如大文件读写),这组测试可以充分发挥存储厂商在性能调优上的主动性。测试包括:
- IO Easy:write/read
- MDTest Easy: create/stat/delete
IO500专门设置了一组苛刻的测试流程(如随机读写3901 Byte数据),以及海量小文件的读写,以此来评估存储系统在极端场景下的性能底线。测试包括:
- IO Hard:write/read
- MDTest Hard:create/stat/read/delete
- Find索引
最终,通过IOPS和带宽的测试数据,计算出整个存储系统的性能评分。
IO500的测试基准,从设计之初,就设立了以下目标:
代表性:IO500的测试基准应该代表在真实系统上观察到的典型工作负载。这包括可调优和优化的工作负载,也包括交互的、原始的及不可优化的工作负载。IO500利用IOR、MDTEST和标准POSIX来对可优化的顺序IO、随机IO以及元数据操作等类型的工作负载进行性能评估。
易理解:IO500将生成有意义的度量和评价体系。测试指标对数据中心用户来说是有意义的。尽量将测试偏差降低(即减少测试步骤差异带来的影响),尽可能使重复测试可获得相近的结果。对于每个单独的性能运行,IO500使用以GiB/s和kIOPS为单位进行统计。除了综合得分之外,还保留了个别值,以方便进行更细致的评估。
可扩展性:可以在任意规模的大型计算机及存储系统上运行,并根据使用的客户端/服务器端节点数量和每个节点的进程来评估测试结果。
可移植:基准测试应该涵盖各种存储技术和非POSIX API。提供不同版本的软件包和工具,减少用户在不同平台上进行测试的时间投入,使测试尽可能流畅地进行。
权威性:IO500旨在提供可信赖的基准性能测试结果,并且防止(无意中)作弊。向IO500提交的报告中,要求披露结果提供者所做的性能优化参数。这些参数将作为结果的一部分与业界进行分享,让其他人通过调整有用的选项来进一步理解测试。
IO500由存储业界的国际知名厂商代表和学者组成委员会,公平接受全球厂商、研究机构提供的存储系统性能测试数据,并对结果进行发布,IO500排名已成为高性能存储领域及其重要的评价指标。
YRCloudFile
YRCloudFile是焱融云推出的高性能分布式存储,此次参与的是IO500 10节点测试。IO500 10节点测试将基准性能测试限制为10个节点,评估在10节点上系统发挥出的***性能。这样的集群规模十分贴近于大多数的中小规模应用场景,其测试数据对客户而言也非常具有参考和借鉴意义,YRCloudFile在这样的规模下对集群的优化也可以为大量用户提供***实践。
焱融云YRCloudFile通过支持RDMA、NVMe等新型高性能设备和技术,以及高效的读写引擎,降低了数据在读写过程中的开销,可扩展的元数据集群有效应对海量文件场景下系统对元数据操作的压力(MDTest Hard)。使YRCloudFile在及其有限的硬件配置环境下,依然发挥出优异的性能,获得理想的性能基准测试结果。
YRCloudFile所提供的高性能存储对人工智能(AI)、大规模仿真(Simulation)、电子设计自动化(EDA)、生命工程(Life Science)、资源勘探等应用领域至关重要。
除了高性能访问的能力外,YRCloudFile还提供了友好的数据治理功能,帮助用户快速定位系统热点(FileSystem Hot Spot),系统数据分析(FileSystem Insight)等功能,使管理员能更好掌控存储集群并进行相应调整。
在未来,焱融云还将继续在YRCloudFile的性能优化上投入更多资源,进一步提升和优化性能指标,为人工智能等众多新兴场景提供***的数据管理支持。