在数字经济时代的今天,人工智能已经成为推动企业创新的核心技术。根据IDC预测,到2025年,中国的生成式AI软件市场规模将达到35.4亿美元。面向生成式AI与各种大模型应用的飞速发展,企业一方面需要以更高的算力来提高模型效率;另一方面,还需要不断升级存储系统,以解决高速增长的数据存储难题。
2024年十月,西部数据宣布正式出货容量高达32TB的 UltraSMR HDD和容量高达26TB的CMR HDD。两款产品均采用11碟架构设计和能量辅助垂直磁记录(ePMR)技术,成功实现了单盘容量的进一步突破,为AI存储以及超大规模云、云服务提供商和企业提供优质的存储解决方案。对于全新的11碟架构设计所带来的容量提升,具体能够为企业带来哪些收益?本文将一一解读。
生成式AI时代,为何还需要大容量机械硬盘
谈到生成式AI和大模型存储,很多用户都会联想到以性能著称的固态硬盘SSD或高带宽内存HBM。那么,在生成式AI时代,为何还需要大容量机械硬盘呢?
生成式AI和大模型的应用需要处理的数据量巨大,参数规模已达万亿级别,且仍在不断增长。这意味着存储系统必须提供足够的容量来存储这些数据。据IDC调研,到2028年,全球将产出393.9ZB的数据。如何更加有效地存储这些数据,成为企业面临的一大挑战。
如此庞大的数据量,若全部存储在SSD设备中,成本将非常高昂,这显然不符合企业的要求。相比之下,机械硬盘仍具有以下几个方面的优势:
一是更大的数据存储容量和更低的总体拥有成本(TCO)。随着技术的进步,HDD的单盘容量不断提高。以西部数据旗下最新的企业级产品Ultrastar DC HC690 SMR HDD为例,该产品的单盘容量已达32TB,每GB的性价比更高,能够更好地降低数据中心的存储成本,提供经济高效的存储解决方案。此外,对于温冷数据的存储,读写性能并非数据中心系统设计的重点,在一些更注重顺序读写的应用场景中,HDD的优势不容忽略。
二是数据存储持久性。机械硬盘因其非易失性特性,在断电情况下也能保持数据不丢失,这对于确保数据的安全性和完整性至关重要。即使在数据丢失或损坏的情况下,从机械硬盘恢复数据通常比SSD更容易且成本更低。
三是复杂环境下的适应性。机械硬盘在某些环境条件下可能比固态硬盘更耐用,如在极端温度条件下。由于技术已经非常成熟,且在许多数据中心中已广泛部署,其可靠性和维护经验已被充分验证。
如西部数据所述,AI系统会处理和生成海量数据,而这些数据都必须被高效地存储。无论是在AI原始数据收集、摄取和存储的输入端,还是在AI内容生成和保存的输出端,HDD在这整个数据存储生态中仍发挥着举足轻重的作用。
技术创新突破容量瓶颈,为AI存储带来更优选择
众所周知,在数据中心相同机柜中,采用单盘存储容量越大的硬盘,不但能够存储更多的数据,而且还能够有效降低数据中心的占地面积和整体功耗,进一步提高数据中心的TCO。
在HDD技术的发展路径中,研究人员主要是通过两个方向来实现更大的单盘容量:其一是通过增加每片磁碟的容量密度;其二是在HDD内装入更多的磁碟来实现。西部数据一直以来也都是采取两步走的方式,首先通过如ePMR(能量辅助垂直磁记录)、UltraSMR、OptiNAND等技术不断推高单碟容量,此外则是通过在机械工程领域的突破,在不改变标准3.5英寸HDD外壳尺寸的前提条件下,装入更多的磁碟。
<西部数据11 磁碟架构设计示意图>
过往通过增加磁碟数量提升容量,主要依靠减少磁碟厚度和缩短磁碟间距的组合方案。然而,对于11碟设计而言,如果能保持磁碟厚度不变可以显著提高制造效率。因此,西部数据并未采用减少磁碟厚度的技术方案,而是创新性地专注于缩短磁碟间距,即减少每两个磁碟之间的间隙距离来提高单盘存储密度。
HDD在运行时,磁碟最外圈会以超过80英里/小时129公里/小时的线速度旋转,同时,带有读写磁头的机械臂会在旋转的磁碟上方飞行,以检索或写入数据。西部数据介绍道,每一代产品的更迭,都需要更高的精密度,使HDD的读写磁头能够在旋转的磁碟表面精确飞行,这就好比让一架747客机在距离地面一毫米的高度飞行,而不触及地面。
资料显示,为了适应磁碟间距的缩短,需要采用一个更低矮的悬挂装置,使读写磁头能够精确稳定地在磁碟表面飞行。为此,西部数据的开发团队将变更控制在最小范围内,以确保能够在很大程度上保持西部数据领先业界的第二代三阶寻轨定位系统(TSA)不变。
然而,仅仅是缩短磁碟间隙,这还不够。在确定了磁碟间距之后,仍然需要额外的节省空间,来确保整体尺寸在行业标准尺寸范围内。这就要求减少硬盘基座铸件的厚度,同时不降低整体结构刚性。因此,西部数据的开发团队开始致力于限制磁碟堆叠的总高度,从而最小化对HDD机箱的影响。这涉及诸多变更——从最小化读写磁头在介质上装载和卸载所需的空间,到与供应链合作减少机械公差,以及优化西部数据制造装配流程中的许多关键环节。
除此之外,在PCBA上,西部数据的设计团队尤其注意不去改变与西部数据HelioSeal技术相关的所有设计和制造工艺,从而确保新的11碟HDD能够保持已出货近1.5亿台的充氦气密封HDD积累的质量和可靠性经验。
对于数据中心而言,功耗是一个非常重要的考虑因素。西部数据表示,为了降低增加磁碟带来的风阻,在11磁碟的产品上还采用了新的设计,以更加符合空气动力学原理,有效应对多个高速旋转磁碟所带来的风阻效应,进一步降低了整盘的功耗。
西部数据公司HDD业务机械工程高级总监Bob Reinhart表示,在不妥协产品性能的前提下增加第11片磁碟,是一项了不起的成就。这不是通过简单一两个改变能一蹴而就的,而是需要对众多设计元素进行仔细检查和优化。看似这只是在目标区域节省了几微米的空间,但正是由于众多这些微小的改进累积起来,才产生了非常显著的成果。
多种容量供用户选择,丰富产品组合赋能企业加速创新
为了满足不同企业不同应用场景的需求,西部数据在全新的11磁碟平台的基础上,成功延续此前多代成功的硬件和固件设计,并采用了西部数据专有的ePMR、UltraSMR、OptiNAND、HelioSeal以及ArmorCache等多项创新技术,向市场提供了丰富的存储产品和解决方案,以满足不同用户需求。
32TB Ultrastar DC HC690 SMR HDD是西部数据采用SMR技术的最大容量产品,顺序读写性能高达257 MiB/s,闲置能耗低至5.5W,为大容量数据中心温数据与冷数据存储提供了高性价比的产品选择。
<32TB Ultrastar DC HC690 SMR HDD>
26TB Ultrastar DC HC590 CMR HDD采用了西部数据全新一代 CMR HDD,具有高达 288MiB/s 的持续传输速度,闲置能耗低至 5.6W,为用户提供了出众的大容量以及无缝的认证和集成能力,实现更高效的部署,同时保持卓越的可靠性和稳定性。
<26TB Ultrastar DC HC590 CMR HDD>
26TB WD Gold SATA HDD是西部数据专为系统集成商和经销商设计的26TB WD Gold HDD,拥有5年有限保修和高达250万小时的MTBF(预计),为中小企业和设计专业人士提供了卓越的性能、可靠性、耐用性和灵活的容量选择。
<26TB WD Gold SATA HDD >
Bob Reinhart表示,新的11碟平台在保持创新的同时,也更加注重产品的生产效率,满足用户不同应用场景的选择。目前,CMR和SMR的产品容量已分别高达26TB和32TB,西部数据正在继续迈向50+TB的征程。
写在最后:
创新是推动技术和产品发展的根本要素。不难发现,面对AI时代不断增长的大容量数据存储需求,西部数据正在通过不断的技术创新,来满足不同应用的数据存储需求,为AI时代的数据存储保驾护航。