如今,基于闪存技术的SSD硬盘技术得到了快速发展,并成为推动系统内存和存储层次结构性能提升的关键因素,这些系统具有广泛的使用案例,并且可以在云端和本地部署数据中心应用中时提高性能,或作为混合存储系统架构的一部分。
企业SSD硬盘使用量在过去五年中的增长令人印象深刻。根据Gartner、The Register和Stifel几家调研机构最近发布的行业数据,2012年至2017年间,企业级SSD硬盘市场收入从30亿美元增长到114亿美元,复合年增长率超过30%。与对应的HDD硬盘相比,企业SSD硬盘使用量的增长十分显著。根据Gartner、The Register、Stifel在2017年提供的最新行业数据,企业级SSD硬盘的市场规模超过了企业级HDD硬盘的市场规模 。
近年来SSD硬盘的迅速发展导致了各种内存和存储技术的创新发展,这些创新的产品正大量应用在内部部署的数据中心和云端。
此外,基于闪存的SSD硬盘的可用性已经实现了广泛的创新解决方案,增加了基于闪存的SSD硬盘的整体价值和适用性。
这些包括:
- 英特尔公司的“Optane内存加速器/扩展器方案”旨在通过闪存的功率和非易失性提供类似内存的性能。
- 软件定义存储,例如WekaIO公司的存储设计,旨在无缝集成SSD硬盘和HDD硬盘,以优化性能和成本。
- NVMe over Fabric,旨在通过广泛的网络扩展SSD设备的域和范围。
这些和其他NAND/SSD的发展将有助于SSD硬盘的日益普及,并确保计算机设计人员和用户在选择有效的内存/存储层次结构时拥有最佳可用选项。
NAND闪存和SSD:弥合内存和硬盘之间的差距
跨越从桌面电脑到高性能计算(HPC)的IT设备范围的计算机设计人员越来越多地寻求通过使用更复杂的内存/存储层次结构来提高系统性能的方法。然而,这些设计师在价格和性能折衷方面面临着相当大的设计复杂性。
通常,具有更快访问速度和更高数据带宽的较低存储容量的设备(例如内存)是存储器/存储层次结构中最昂贵的元件,但是可能对计算机的整体性能具有最直接的影响。与其相反,尽管与基于闪存的同类储能产品相比,数据访问时间较慢,数据带宽能力也较低,机械硬盘每单位存储的成本要低得多,并且可以提供比内存更多的存储容量。
在过去几年中,NAND闪存设备领域的技术进步已经产生了新的存储器和存储技术(SSD硬盘),而从系统设计者的角度来看,可以在性能和成本指标方面弥补内存和HDD硬盘之间的差距。
?在最基本的层面上,NAND闪存是一种非易失性(NV)半导体存储器件,即使存储器件断电,也可以安全地存储数据。相反,内存需要持续供电以保持存储的数据完整。NAND芯片及其封装方案直接关系到它们是用作与HDD硬盘,协同工作的SSD硬盘,还是用作基于内存补充的增强主存储器。
?然而,NAND闪存设备并不是目前SSD硬盘中唯一使用的设备选项。一个值得注意的例子是英特尔公司的Optane SSD硬盘,它使用称为3D XPoint的专有高性能技术,与NAND闪存一样具有非易失性,但可以提供更好的耐用性和更快的数据访问时间。此外,与内存的情况不同,3D XPoint芯片中的每个存储单元在每个存储位置都不需要开关晶体管,从而存储密度比内存要高8倍至10倍。
随着更低成本和更大存储容量闪存设备的出现,IT设计人员和用户越来越多地转向基于非易失闪存(NV)的SSD硬盘,以优化其整体内存/存储层次中的数据访问和传输时间。基于闪存的SSD硬盘具有许多优点:
- 速度:使用SSD硬盘的主要好处是在延迟和IO方面的性能是HDD硬盘性能的100倍。这意味着更快的启动时间、更快的文件传输,以及更高的企业计算带宽。
- 总拥有成本或TCO:虽然HDD硬盘的硬件成本较低,但SSD硬盘的带宽成本可能低得多。对于企业而言,这通常比获得简单驱动能力更重要。预计企业级固态硬盘的使用寿命也会延长,从长远来看可以节省成本。
- 功耗:通常SSD硬盘比HDD硬盘消耗更少的电能。与HDD硬盘相比,这可以节省成本,并且在运行期间减少热量产生。
NVMe协议的崛起
在SSD硬盘出现的早期,从2005年到2010年,大多数固态硬盘都使用已建立的通信总线标准,如SATA或SAS,以便与计算机系统的其余部分连接。但是,由于这些协议是针对HDD硬盘的性能规格而设计的,因此随着时间的推移,它们越来越不足以满足SSD硬盘的典型访问时间和更高的数据速率。2011年发布了专门针对SSD硬盘开发新标准的努力。
这个名为NVMe的新主机控制接口是一个开放式逻辑设备接口,从头开始设计,充分利用基于闪存存储设备的低延迟和内部并行性。从本质上讲,NVMe是一种允许SSD硬盘在计算机中有效使用高速PCI Express总线的规范。目前,NVMe适用于各种外形的硬盘。
NVMe功率范围涵盖全功率企业设备和低功耗移动设备,并且在大多数主要操作系统(包括Linux、Windows、Unix和VMware)中提供广泛支持。NVMe在机械磁盘和基于SATA的SSD硬盘的性能优势令人印象深刻。
基于闪存的SSD硬盘存储市场增长强劲
企业级SSD硬盘在过去五年中的增长令人印象深刻。根据Gartner、The Register和Stifel最近提供的行业数据,2012年至2017年间,企业级SSD硬盘市场收入从30亿美元增长到114亿美元,复合年增长率超过30%。
这种增长是由多种因素共同推动的:
- 针对SSD硬盘存储单元必不可少的NAND芯片具有强大且极具竞争力的供应商基础。
- NAND闪存供应商和SSD硬盘开发人员的重大技术进步解决了NAND芯片的一些固有技术缺陷(例如写入时间长,读/写周期有限)。
- 技术和企业用户群中越来越多的用例,用于响应更快的内存/存储层次结构,为越来越苛刻的多核CPU和许多核心GPU处理器设计提供数据。
- 大数据分析应用程序的兴起,其中许多具有实时、独特、结构化和非结构化数据访问和分析要求。
与对应的HDD硬盘存储相比,企业SSD硬盘使用量的增长令人印象深刻,如图1所示。根据Gartner、The Register和Stifel在2017年提供的最新行业数据,销售的企业级SSD硬盘的市场规模首次超过了企业HDD硬盘。2017年,企业SSD硬盘的销售额达到了115亿美元,超过了销售额略高于110亿美元的HDD硬盘。
- 2012年,企业HDD硬盘的市场收入几乎是同类SSD硬盘的三倍(分别为88亿美元和30亿美元)。
- 2012年至2017年间,HDD硬盘的收入增长了4.4%,而SSD硬盘在同一时间段内的复合年增长率超过30%。
图1 全球企业级HDD硬盘和SSD硬盘的市场收入
IDC和Stifle公司最近的估计显示,SSD硬盘/HDD硬盘定价比率将继续下降,如图2所示。根据这一预测,到2021年,每GB 的SSD硬盘价格仅为对应容量的HDD硬盘的两倍。
图2 每GB 的SSD硬盘与HDD硬盘价格(美元)
基于闪存的SSD硬盘在数据中心的应用
近年来SSD硬盘的迅速发展导致了各种内存和硬盘创新的发展,这些创新已经应用在内部数据中心和云端。
这些创新包括:
(1)HDD硬盘文件系统的数据缓存
在通常情况下,企业或技术计算系统将最活跃数据的临时副本存储在基于闪存SSD硬盘中,并将相同数据的永久副本存储在对应HDD硬盘上。选择存储在缓存中的数据至关重要,因为缓存的存储容量比HDD硬盘系统小得多。高速缓存数据选择算法尝试确保在需要时高速缓存中最活跃的数据可用。这种选择过程是这种高速缓存系统整体性能的关键决定因素。
这有很多优点:SSD硬盘提供了显著改善访问时间和数据带宽的功能,而HDD硬盘可以以较低的存储价格,提供更大的整体存储容量。此外,使用此类缓存允许设计人员优化系统的互连方案,以支持较小的缓存系统,而无需开发高性能且成本更高的网络来访问整个HDD存储基础架构。
(2)混合SSD/HDD硬盘阵列
在混合HDD/SSD硬盘阵列中,计算机的整体存储系统由HDD硬盘和SSD硬盘组成。根据包括总体预算、数据访问和带宽要求、互连方案、电源和冷却功能,以及预期系统工作负载的数据访问模式可预测性和影响等因素,HDD/SSD硬盘阵列组合的确定可能会有很大差异。在这里,人们对SSD硬盘与HDD硬盘价格/性能的权衡,需要彻底了解哪些数据需要驻留在哪种类型的存储硬件上,以便利用每种类型的最佳功能。
- 混合阵列方案的一个优点是,可以根据有关工作组合,预算增加或甚至新要求的新信息或不断变化的信息,直接将SSD硬盘、HDD硬盘或两者的组合添加到整个存储系统中关键应用程序的性能改进。
- 尽管具有这些优势,但混合存储阵列需要一定数量的数据,这些数据由控制软件完成,该控制软件持续监视SSD硬盘和HDD硬盘之间用户数据的放置和迁移,以优化整体性能和成本。错误放置的数据可能会导致性能影响最小甚至降低。
(3)突发缓冲区
突发缓冲区是基于闪存NAND的SSD硬盘的一个特定应用,其驻留在专用节点上,该节点桥接给定计算系统的内部互连和通过系统I/O节点访问的存储系统的整体结构。
从本质上讲,突发缓冲区是一组分布式节点,包含板载处理能力和内存容量,可与系统内存(副存储)系统紧密集成,可以管理用户作业的快速存储,提供缓存服务,支持传输分析和处理,并为小型块的传输启用加速应用程序支持。
(4)全闪存
顾名思义,所有闪存都是基于闪存的SSD硬盘专用于系统的存储而无需使用HDD硬盘。然而,尽管从性能角度来看,SSD硬盘具有诸多优势,但在目前大多数情况下,SSD硬盘的价格与对应HDD硬盘的价格相比,限制了全闪存存储系统的使用。
SSD硬盘在许多企业系统中的总体应用趋势将成为一个越来越广泛的存储选择,最初是那些具有严格和明确定义的性能要求,但随着SSD硬盘和HDD硬盘之间的成本差异缩小而扩大其应用。
闪存存储趋势值得关注
在基于闪存的整体SSD硬盘领域中,许多趋势/发展为越来越多的计算机体系结构,数据中心配置和用户工作负载带来了额外的性能提升。无论是单独工作还是与其他SSD硬盘技术协同工作,这些开发中的每一项都有助于进一步推动闪存在整个IT服务器生态系统中的广泛采用。
3D NAND:基于闪存的SSD硬盘推动增长
NAND闪存是提高SSD硬盘成本、耐用性和读/写性能的最大因素,而3D NAND技术的出现,使得多层存储单元垂直堆叠,对SSD硬盘容量和功能的最新改进做出了重大贡献。3D NAND闪存在比2D NAND闪存更小的物理空间中提供更高容量的潜力。与NAND闪存相比,3D NAND可降低存储成本,改善电气使用,以降低功耗,提高可靠性,并提供更高的数据写入性能。
最新的顶级企业级基于3D NAND的SSD硬盘设备具有令人印象深刻的功能,其中包括:
- SSD硬盘存储容量超过11TB
- 5.5GB/s的顺序读取和高达3.5GB/s的顺序写入
- 平均故障时间(MTTF)为300万个设备小时
- 功耗低于6W
- 更换24个HDD硬盘机架的容量(基于IO/s性能)
- 尺寸为2.5英寸
从图3中可以看出,根据IC Insights公司的行业调查数据,全球生产的所有NAND闪存中约有25%用于SSD硬盘(客户端和企业),仅次于智能手机,但远远领先于存储卡。然而,许多业内人士预计,基于闪存的固态硬盘的价格/性能选择的增加,企业级存储方案中对快速内存的新需求以及智能手机销售增长的预期放缓可能会推动固态硬盘的发展,并在未来几年处于前沿。NAND闪存市场由许多技术领先的供应商公司提供,其中包括英特尔、美光、三星、SanDisk,以及SK海力士,这几家公司都有强大的研发力量,并将其NAND闪存开发路线图扩展到未来十年。SSD硬盘作为闪存设备的最大消费者的出现,确保了闪存制造商将其开发工作集中在最适合SSD硬盘要求的芯片上。
图3 2018年在全球分销NAND闪存产品分布
英特尔Optane存储系统:扩展快速存储性能
英特尔公司的Optane存储系统开发旨在解决内存和磁盘之间的性能差距,并充分利用了英特尔公司先进的半导体设计和生产能力。以及与其自己的处理器直接通信的能力。
Optane内存的目标不是替代基于闪存的SSD硬盘,而是作为基于DRAM的内存扩展器或快速缓存设备,可与更传统的3D NAND闪存SSD硬盘配合使用,如图4所示。
Optane存储系统旨在将内存的快速访问时间和长续航能力与NAND闪存的密度和非易失性的优势相结合。Optane存储器模块于2015年推出,基于一种名为3D XPoint的新型半导体存储设计,该设计使用垂直导线的交叉点结构来访问单个存储单元。
图4 英特尔Optane SSD用例
3D XPoint芯片的优势很多:它们像NAND同类产品一样具有非易失性,但具有更高的耐用性和数据访问时间。此外,与DRAM内存中的情况不同,3D XPoint芯片中的每个存储单元在每个存储位置都不需要采用开关晶体管,从而允许比DRAM内存更高的存储密度提高8倍至10倍。
此外,英特尔公司可以通过PCIe总线或非常快的DDR总线直接支持其处理器和Optane SSD硬盘之间的互连选项,充分利用提供集成处理器/内存子系统的优势。然而,由于该技术相对较新且制造复杂,3D XPoint芯片目前的总存储容量远小于领先的NAND芯片,目前Optane产品仅在16和32GB范围内,远低于SSD硬盘TB级范围的容量。
NVMe Over Fabric
如前所述,NVMe协议是一种允许SSD硬盘在计算机中有效使用高速PCI Express总线的规范。该规范虽然在单个计算机系统中有用,但不支持跨网络的SSD硬盘访问。为解决该问题,NVMe over Fabrics(NVMeoF)旨在使低延迟NVMe SSD硬盘能够以最有效的方式扩展到网络,从而简化设计,降低开销,并提高性能。
大约90%的NVMeoF协议与本地NVMe相同,其中包括NVMe命名空间、I/O和管理命令,寄存器构造,异步事件管理。主要区别在于标识符命名约定和数据传输配置。
软件定义存储
软件定义存储(SDS)是一种相对较新的存储范例,基于服务器的软件管理数据存储资源和功能,并且不依赖于底层物理存储硬件方案。与存储区域网络(SAN)和网络附属存储(NAS)系统不同,软件定义的存储产品使用户能够单独(并且更优化)管理存储硬件和软件。
- 软件定义存储(SDS)产品的共同特征包括聚合存储资源,跨服务器集群扩展系统,通过单个管理界面管理共享存储池和存储服务,以及设置策略以控制存储特征和功能。
- 软件定义存储的一个关键特性是它可以提供集成的数据管理容量,该容量可在整个文件系统中集中管理。此功能可以减少对数据高速缓存的需求,例如传统文件系统(如Lustre或GPFS)常见的突发缓冲区,同时在小文件、元数据或随机I/O操作上提供卓越的性能。
在许多情况下,软件定义存储(SDS)供应商希望将SSD硬盘集成到整个内存/存储层次结构中,以便将SSD硬盘的优越访问时间和数据带宽与基于云计算的HDD硬盘的灵活性和经济优势相结合。WekaIO公司提供了一个示例,为此提供了一个闪存原生并行文件系统,这是一个纯软件解决方案,旨在优化NVMe、SAS或SATA SSD上的闪存性能,并管理数据迁移到基于云计算的HDD硬盘存储在本地或在公共云中运行的系统。
WekaIO基于Matrix 3.0软件的横向扩展存储解决方案经过优化,可利用闪存技术的性能,无论是随机还是顺序支持大小文件访问。它可以本地部署在云端,将计算和存储集成到应用程序集群中,也可以作为专用存储服务器(设备模型),从而消除数据中心成本和复杂性。
管理数据移动和促进高速数据的WekaIO Matrix v3.0软件可在各种用例中提供显著的性能,包括大数据分析、生命科学、金融服务以及关键的应用程序,如气候变化模拟,地震模拟和空间研究。
WekaIO SDS的一个引人注目的用例是在深度学习领域,从存储到计算机的GPU补充的训练数据的数据传输问题是一个关键的性能瓶颈。在这种情况下,WekaIO软件部署在通过以太网或InfiniBand低延迟网络互连的专用服务器集群上。服务器集群资源(CPU、内存、网络连接、SSD硬盘)分配给WekaIO软件。在此设置中,WekaIO SDS可以为每个GPU提供完整的5GB/s,同时利用S3兼容的基于HDD硬盘的对象存储,实现大规模的经济高效存储。图5提供了用于深度学习基于GPU的解决方案的WekaIO存储解决方案的示例架构。
图5 适用于GPU集群的WekaIO SSD存储解决方案
未来的展望
基于闪存的固态硬盘将继续发展,它们可能成为推动具有广泛用例系统的内存/存储层次结构性能提升的关键因素,并且可以在本地运行时提高性能,在云端或作为混合系统架构的一部分。
3D NAND芯片和随后的NAND芯片架构的进步,再加上使用它们的基于闪存的SSD设备,对于整个SSD领域尤其是高性能存储系统来说是个好兆头。从速度、功耗以及越来越多的总体拥有成本(TCO)角度来看,基于闪存的SSD硬盘与HDD硬盘相比具有明显的优势。
基于闪存的SSD硬盘的推出使得各种创新解决方案得以实现,其中包括英特尔公司的“Optane内存加速器/扩展器”,旨在提供类似内存的性能以及闪存的功率和非易失性,以及来自WekaIO的软件定义存储无缝集成SSD硬盘和HDD硬盘,以优化性能和成本;采用NVMe over Fabric,旨在通过广泛的网络扩展SSD硬盘的领域和范围。这些以及其他开发工作将会促进SSD硬盘的日益普及,并确保计算机设计人员和用户在考虑高效的内存/存储层次结构时拥有最佳可用选项。