云计算提供商提供了许多不同的存储服务,但是对于大多数应用程序来说,这些服务都不是理想的,因为它们使企业存储供应商处于繁重的存储业务中。那么,云计算供应商是否能够取代关键应用程序的现场存储?
亚马逊网络服务(AWS),谷歌云平台(GCP)和微软Azure等云计算提供商都提供各种云服务,从高性能、基于SSD的容量到长延迟存档存储,其价格优惠范围从高到低。但是大多数应用程序都有各种I/O需求,从对延迟敏感的元数据更新到带宽吸收备份。没有单一的云存储服务是理想的。
应用程序开发人员知道这一点,并经常在其代码中执行非自然的行为以克服云存储缺陷。两个主要问题是成本/性能权衡和非弹性部署边界。
成本/性能权衡
存储层次结构(更简单的时内存、磁盘和磁带)反映了权衡。快速存储是昂贵的,并且廉价的存储速度是缓慢的。
为了适应不同的工作负载,企业存储阵列可以自适应地移动数据,将热数据传输到快速缓存,并将冷数据移动到磁盘,或者在某些情况下,一直移动到云存档。但这很难与云存储相关,因为不同的服务需要显式部署,并提供不同的一致性保证。
非弹性部署
云存储服务也倾向于仅提供单一度量弹性。例如,AWSS3服务随容量而扩展,但不随I/O需求而扩展。DynamoDB可根据I/O需求进行扩展,但在低延迟配置中却非常昂贵。
在最近的一篇论文中,Cal Berkeley公司的研究人员探索了一种先进的键值存储系统Anna,旨在克服当前的云存储限制。键值存储基本上是两列电子表格,其中***列包含访问键,第二列包含企业要存储的数据。
键值存储已广泛用于云服务,但Anna实现了三个重要的优化。
- 用于缩放的水平弹性
- 垂直数据移动,以适应不断变化的访问模式
- 跨多个核心和节点选择性复制热数据密钥,以扩展访问性能。
这些优化旨在满足聚合吞吐量增长,热键现实以及工作负载热点转移的需求。
性能
Anna如何实现这些目标有很多细节。但最重要的是:与Dynamo DB相比,它的运作情况如何?
这是一张表,可以对这二者进行比较:
适应热点是另一个考验:
Dell EMC或NetApp公司可能为此感到担忧。规模公共云存储只有不到十年的历史,并且正在迅速成熟,因为企业存储的增长不足证明了这一点。
Anna不仅对提高绩效非常重要,而且对成本的关注也很重要。云存储标费率似乎合理,但是当企业为目录查找和数据网络添加所有开销成本时,企业存储更具竞争力。
任何能够以更低的成本提高存储效率的东西都是数字文明的胜利。但对于企业存储供应商而言可能并非如此。