从2008年将SLC存储介质引入EMC DMX开始,向全闪存存储过渡约有十年的时间。存储供应商一直热衷于采用全闪存系统作为传统存储的最终替代产品。但是,当新的存储媒质进入数据中心时,现在是重新审视混合存储系统概念的时候了。
分层存储
分层存储或混合存储的概念几乎与人们拥有共享存储平台的时间一样长。存储供应商为此改善和调整存储解决方案,以下将对演进的各个阶段进行介绍。
归根结底,分层存储是一个成本/收益等式。快速存储介质的成本很高,而一次只有一小部分数据处于活动状态。对于运行传统应用程序(例如数据库或LAMP堆栈)的企业,大多数数据将处于非活动状态。当查看非结构化内容时,这种情况甚至更加明显,除了可能出于机器学习/人工智能目的处理数据。
全闪存
全闪存存储的想法是一个很好的营销故事。不得不担心I/O响应时间不均匀的问题的日子已经一去不复返了。所有数据都位于一个统一的层上,可以提供一致的性能。
当企业选择在全闪存和基于SLC/MLC和硬盘的混合解决方案之间进行选择时,HDD硬盘与SSD硬盘的I/O延迟之间的性能差距是如此之大,以至于混合平台牺牲了性能,但降低了成本。将全闪存阵列分层没有意义,因为从SLC升级到MLC的最初收益全部是通过节省边际成本实现的。
传统混合存储解决方案
传统混合存储解决方案面临许多挑战:
- I/O一致性。以上已经讨论了这一点,但值得再次强调。与闪存相比,企业级15K硬盘可提供200个完全随机的IOPS和250MB/s的连续吞吐量,而闪存具有数十万个IOPS,并且在任何工作负载下的吞吐量可能为500~600MB/s。闪存的性能超过HDD硬盘,如果用户的数据跨越这两个层次,则情况更糟,因为将获得无法预测的性能结果。
- 追溯平衡。几乎所有分层或混合解决方案都使用历史I/O配置文件信息重新平衡数据。这个过程意味着存储系统总是在追赶应用程序,而从来没有充分发挥基础存储介质的优势。当仅仅为了重新平衡工作负载而将数据移入和移出层时,主机的I/O容量可能会丢失,而且无法充分利用存储介质功能。
- 比率管理。正确确定每个存储层的百分比是一个大问题。大多数传统存储设备具有基于固定RAID大小的存储层或存储池。扩展池可能很昂贵,因为许多平台不提供添加单个硬盘驱动器的能力。
新的存储介质
全闪存系统的最初应用浪潮是基于昂贵的SLC存储。这很快演变为便宜的MLC,如今人们看到供应商在其产品中引入了TLC和QLC闪存。从SLC到QLC存储介质过渡的有趣之处在于单位成本的降低,但是也看到了持久性的降低和I/O延迟的增加。
持久性
持久性是NAND闪存的致命弱点。将数据写入NAND介质会使其耗尽,并且高容量QLC驱动器的耐用性比原始SLC产品低得多。幸运的是,人们已经看到NAND和闪存驱动器供应商的惊人工作,它们使用错误校正和其他算法来扩展SSD硬盘的使用寿命。
市场上最新的存储介质当然是Intel Optane或3D-XPoint。与NAND闪存相比,Optane无需担心持久性。该技术也可以将其置于存储层次结构的闪存和内存之间。
如果人们相信这种传言,那么PLC即使容量有所增加,其持久性也会很低。
固态混合存储
人们很可能会看到的另一个选择是使用任何可用存储介质类型的混合。随着非结构化数据的增长,价格更低的硬盘仍将发挥重要作用。与公共云相比,本地对象存储提供了更好的成本配置,因此继续在本地存储大量数据在财务上是可行的。当然,在许多情况下,闪存介质的成本是不合理的,例如,用于测试/开发的数据复制或诸如媒体和娱乐之类的内容处理。因此,可以预期硬盘将在未来几年内更多的应用。
架构师的观点
存储系统的设计不可避免地面临一些难题,但当没有多层闪存产品可用时,全闪存是一个很好的解决方案。
集中存储的优点是可以通过在共享平台中使用多种存储介质来优化成本,而这在分布式解决方案中是无法实现的。但是,平台架构必须以有效的方式支持新的存储介质。从规模上来说,这提供了本地连接存储无法比拟的设计,从而使共享阵列和混合阵列都在市场中得以应用。
未来存储架构仍然是混合的,因为始终要考虑存储介质的成本。而最终胜出的存储解决方案是最有效利用成本的解决方案。