体育产业如今成为产生下一代技术和大量数据的温床。随着每一赛季的结束,将不断涌现数字内容。从跟踪球员的统计数据和表现分析,到从多个摄像机角度、在各个体育场馆中捕捉每场比赛中每一个动作的视频片段,大量数据都需要存储在某个地方。
为了在捕获实时动作的同时逐分钟提供数据丰富的文件,数据管理团队必须决定将热数据、温数据或冷数据存储在何处,具体取决于他们需要访问数据的速度和频率。
但这不仅仅是体育产业面临的问题。专家估计,全球数据量每年增长约30%,到2025年可能会产生175ZB的数据。虽然并非所有数据都需要立即分析,但存储是必不可少的,这就是冷存储发挥作用的地方。
冷存储的兴起
冷存储用于保留未在使用的数据,这些数据可以存储在档案中,也称为“冷”存储。这些是成本较低、不常访问的存储层,而不是需要立即访问的实时“热”数据(如金融交易)。
行业分析师认为,这是一个短期内不会消失的存储细分市场,60%或更多的数据可以存档或存储在更冷的存储层中,直到需要采用为止。
随着全球生成和存储的档案数据比以往任何时候都要多,冷存储正在成为该行业增长最快的细分市场。随着越来越多的数据被存储,云计算供应商正在通过可访问的档案重塑他们的架构,以跟上数据增长的步伐并确保有效管理。
采用冷存储的好处
随着数据的增加并达到ZB时代;存储的数据越多,成本就越高。大量数据通常是非结构化或半结构化数据,例如视频片段、基因组学或用于训练机器学习和人工智能的数据。其中很大一部分可以存储在二级冷存储中,远远低于热存储的成本。对于那些虽然是活动流程的一部分但不需要立即采用的数据,以较低的成本将其存储在较冷的存储池中可能是一种解决方案。
但是,使用冷存储时最大的考虑因素是企业需要访问数据的频率或数据的可用性。如今的云存储服务级别协议是围绕数据需要访问的频率以及客户愿意等待多长时间来检索数据而构建的。云计算提供商可能需要5到12个小时才能访问存储在较冷层中的数据,而存储在较热层中的数据可以立即使用,但需要支出更多的费用。
除了成本和可访问性的考虑因素之外,最终用户的心理是第三个因素。删除任何内容让人难以接受,以防在某个时候可能需要它而永远不知道哪些数据以后会有价值。
目前有哪些选择?
直到最近,大多数二级冷存储都包含在磁带或硬盘驱动器(HDD)上,热数据转移到SSD硬盘上。然而,根据Horison Information Strategies公司的调查,到2025年,归档数据可能会达到所有捕获数据的80%或更多,使其成为迄今为止规模最大、增长最快的存储类别,这将带来巨大的存储挑战。此外,数据的价值通常与访问和挖掘数据的能力有关。换句话说,数据可访问性增加了数据价值。
虽然磁带存储比HDD硬盘便宜,但它也具有更高的数据访问延迟,使其成为仅用于冷存储的选项。HDD硬盘正在向下一代磁盘技术和平台发展,以提高拥有成本和归档解决方案的可访问性。HDD硬盘技术的最新进展包括新的数据放置技术,如硬盘分区、更高的分区密度、机械创新、智能数据存储和新材料创新。
冷存储将如何发展?
拥有最大数据池的超大规模厂商和数字内容创建者正在寻找最具成本效益的方式来存储其不断增加的数据量。为了满足数据存储需求,新的冷存储层正在出现,IT组织正专注于重塑档案存储架构以做好准备。
随着存储最长久的数据所需的时间超过一个世纪,经得起时间考验的面向未来的冷存储解决方案将成为关键。为了确保它们的持久性,行业厂商正在开发诸如DNA、光学甚至海底深度冷冻存储等创新技术。
最近成立的DNA数据存储联盟是推动冷存储领域发展的众多活动之一。由于其高密度,DNA能够将大量信息打包到一个很小的空间中,并且可以存在数千年,使其成为档案存储的一种有吸引力的存储介质。
随着ZB数据时代带来了从可持续性到可访问性的挑战,冷存储将被证明是以可承受的价格保存数据不可或缺的一部分,并考虑到数据的使用寿命。因此,需要不断创新来创建长期数据存储解决方案,使具有价值的数据在近期和未来都可以访问。