什么是SCM介质?
SCM(Storage Class Memory)是当前业界非常热门的新介质形态,同时具备持久化(Storage Class)和快速字节级访问(Memory)的特点。当前也有叫SCM为PM(PersistentMemory)介质或者NVM(Non-VolatileMemory)介质。SCM介质的访问时延普遍小于1μs,比当前常用的NAND FLASH快2-3个数量级,读写时也没有NAND Flash顺序写入和写前擦除的约束,操作过程更简单;同时,SCM介质的在寿命和数据保持能力方面的表现也远超NAND Flash。基于这些特点,业界普遍认为SCM会成为颠覆存储系统设计的新一代介质,并优先应用于性能和可靠性要求较高的场景。
SCM介质现状
目前在研的SCM介质种类繁多,但是比较主流的有4个大类: PCM、ReRAM、MRAM和NRAM。
PCM(Phase-change memory)即相变存储器,利用特殊合金材料在晶态和非晶态下的导电性差异来表示0或者1的状态。其优点是结构简单,便于实现大容量和低成本,缺点是对于高温比较敏感。PCM可用于Cache加速场景和大内存应用场景,由于其寿命和内存仍有一定差距,因此需要在系统设计上针对PCM进行优化以避免“写穿”。一个典型的设计优化是搭配DRAM,形成分级的大容量内存资源池,同时满足高性能和高可靠要求。业界SCM的典型代表为Intel和Micron联合研发的3DXpoint。从当前的技术和市场发展趋势看,3DXpoint是未来3年内最具规模商用能力的SCM介质。
ReRAM(Resistive random-access memory)即阻抗随机存储器,通过在上下电极间施加不同的电压,控制Cell(存储单元)内部导电丝的形成和熔断对外呈现不同的阻抗值。其优点是不同阻抗值可以表示不同状态,理论容量密度和成本可以最优;缺点是读写寿命和性能都较低,主要应用于高速的数据存储场景。典型代表厂商为HPE和Crossbar,目前成熟度有待加强。
MRAM(Magnetic Random Access Memory)即磁性随机存储器,通过电流磁场改变电子自旋方向来表示不同状态,理论性能和寿命都很高,适用于贴近CPU侧的高速缓存(如L2 Cache,LLCache),当前理论研究比较成熟,但是工艺成熟度低,实际产品容量密度较小,代表厂商为Toshiba和Everspin。
NRAM(Nantero’s CNT Random Access Memory)即碳纳米管随机存储器,采用碳纳米管作为开关,控制电路通断表示不同的数据状态。由于碳纳米管尺寸非常小并且具备极强的韧性,因此NRAM理论制程可以达到5nm以下,密度和寿命及其优秀,理论功耗也比较低,可用于替代SRAM(Static random-access memory or StaticRAM)的应用场景。当前由Nantero授权其他存储芯片厂商加工,成熟度比较低,距离规模商用仍需很长的发展历程。
SCM介质主要类型和技术特点
站在存储系统的角度,考虑到存储系统对容量密度以及成本有较高的诉求,同时结合其成熟度,华为会重点关注3DXpoint,并进行相应技术预研及产品布局,同时紧密关注ReRAM及其他SCM的发展趋势。
SCM介质产品形态和在存储系统中的应用
高性能SSD
SCM第一阶段的应用形态,是基于NVMe Block接口,兼容原有生态的SCM SSD,如Intel推出的OptaneP4800X系列。这种形态对现有系统架构改变不大,同时提供了相对Flash SSD更高的性能。另外,由于SCM SSD无需垃圾回收操作,避免了NAND SSD长期使用后的性能衰减问题,提供了更稳定的时延。业界基于此形态的存储产品正在逐步出现,华为也在有计划的进行相应产品研发。
这种形态在存储系统中的主要应用方式包括:
元数据缓存:作为AFA产品的元数据缓存,配合DRAM,形成内存+SCM SSD的两级缓存机制,突破内存容量瓶颈,在保持性能稳定的情况下支持更大的用户容量;
数据缓存:作为用户数据的加速层,提升典型应用场景下的性能体验;
主存场景:作为用户数据的存储层,提供高性能存储系统以满足某些场景的性能要求。
字节型DIMM形态
SCM第二阶段的应用形态,是基于内存访问语义(Load/Store),以DIMM的形态接入系统的可持久化内存。这种形态可以提供与内存接近的访问时延(100ns级),并提供相对内存更大的容量和数据持久化能力,是未来超高性能存储系统的重要基础技术。
要利用好这种形态,需要对现有计算机系统软硬件架构进行较大变化,业界在基于持久化内存的数据结构,事务技术,硬件架构,编程工具等各方面均在进行相应的探索。如在网络方面,现有的跨CPU间内存访问受限于网络时延,无法充分发挥SCM介质持久化的特点(即使最快的网络访问也需要3μs以上,远超介质本身的时延)。因此,华为与其他IT巨头共同提出了Gen-Z标准,使得SCM可以独立以Gen-Z接口接入Gen-Z总线,各CPU可以以纳秒级的时延访问共享SCM介质,才能更好的发挥SCM的性能:
现有跨CPU内存访问网络
Gen-Z新一代内存访问网络
DIMM形态存储需要的各项技术仍在探索中,华为也有相应的前沿性研究项目在进行中,在这项技术成熟后,会第一时间应用于华为存储系统中。
小结
SCM介质以其独特的设计原理,极大的弥补了IO设备与内存设备之间的时延鸿沟,同时使内存具备了持久化功能,必将对现有计算机体系结构以及应用方式产生很大影响,在未来很长一段时间会持续成为计算机体系创新的热点,华为也会持续关注SCM的产业化进程,利用这种新的技术,为客户提供创新性的存储产品。