大家遭遇过电脑硬盘故障导致所有数据丢失的情况吗?
得知数据无法恢复后欲哭无泪,一想到几年来保存的生活影像、学习资料,辛苦积累的实验数据竟荡然无存,简直是心痛到无法呼吸!
个人数据丢失已令人难以接受,万一企业级服务器的储存系统崩盘,比如银行的金融服务器、互联网企业的训练服务器发生数据丢失,影响更是难以估量。
为避免此类情况,同时为提高海量数据的读写速率,RAID(Redundant Arrays of Independent Disks,独立冗余磁盘阵列)应运而生。
为了更好地认识RAID,我们先来了解以下概念。
1. 硬盘,磁盘,磁盘阵列?傻傻分不清楚
(1) 硬盘
即硬磁盘,作为现代计算机的主要存储设备,容量大,读写快,主要分为新式固态硬盘、传统机械硬盘和混合硬盘。
(2) 软盘
既然有硬磁盘,当然也有软磁盘(即软盘)。软盘是早期个人计算机使用的可移动储存介质,彼时常用容量仅1.4MB的3.5英寸软盘,读写速度慢,早已淡出市场。
软、硬磁盘统称为磁盘,“磁”表示利用磁记录技术存储数据。
(3) 磁盘阵列
RAID即由独立磁盘构成的具有冗余能力的阵列,简称磁盘阵列。
一般电脑配备1~2个硬盘即可满足基本需求,而企业服务器对于数据的存储容量和读写速度要求极高,普通硬盘远远无法满足。于是工程师们将多个独立硬盘组成一个超大容量组,以提供比单盘更高的存储性能、I/O性能、可靠性。
2. 初识RAID的一些疑问
初识RAID,可能对概念还有一些疑问,小编先进行简单答疑~
3. RAID级别
RAID主要利用分条、镜像、数据校验这三种技术来组合硬盘。首先介绍四种标准型RAID。
(1) RAID 0
又称为条带化或分条,将连续数据(A1 ~ A8)分散写入多个硬盘,能够并发执行读写,充分利用总线带宽,储存性能最高。一旦单盘故障将威胁数据安全,只适用于不求安全、只求速度的场景。
有更安全的方案吗?
(2) RAID 1
又称镜像,将一段数据(A1 ~ A4)分别写入工作盘和镜像盘,相当于全自动实时备份,数据安全性最高。但实现成本高,硬盘利用率低,仅适用于全力保障安全的场景,如金融、监控服务器。
有兼顾性能和安全的方案吗?
(3) RAID 5
将连续数据分散(A1 ~ A3, B1 ~ B3, C1 ~ C3, D1 ~ D3)和相应的奇偶校验信息(Ap, Bp, Cp, Dp, Ep)分别写入不同硬盘,单盘故障时可以利用正常盘数据与奇偶校验信息进行异或来恢复数据。RAID 5兼顾储存的性能、成本、可靠性,常见于民用的各类私有NAS服务器。
两块硬盘同时损坏怎么办呢?
(4) RAID 6
在RAID 5的基础上增加了一组奇偶校验信息(Aq, Bq, Cq, Dq, Eq),两组独立的奇偶校验信息可以实现双重校验,在两块硬盘同时损坏的情况下也能恢复数据。RAID 6读性能与容错性能更高,但写性能低,实现成本高。
将标准型RAID“做加法”,可获取以下三种平衡性能与可靠性的混合型RAID。
(5) RAID 1+RAID 0=RAID 10
RAID 10可理解为:用四个硬盘(Disk 0和Disk 1,Disk 2和Disk 3)分别组成两个RAID 1,再将两个RAID 1组成一个RAID 0。RAID 10兼具二者优点,但硬盘利用率不高。
(6) RAID 5+RAID 0=RAID 50
RAID 50中,由多个RAID 5卷组成一个RAID 0,RAID 50可以承担多个卷内同时发生单盘故障的风险,极大提升了容错能力,同时继承了RAID 0的高储存性能。
(7) RAID 6+RAID 0=RAID 60
RAID 60整体结构及特点与RAID 50相似,还继承了RAID 6的优点,即便多个RAID 6卷内同时发生双盘故障,也不会影响数据的安全性。
各级RAID在读写性能和安全可靠性之间各有侧重,小编做出以下总结:
由表可知,RAID特点是:实现更大的容量、更高的I/0性能、更强的数据安全可靠性。
3. 怎么才能用上RAID呢?
读到这里,相信大家已经知道了RAID的优点,但可能对于如何使用RAID仍心存困惑。其实,RAID有以下三种实现方式:
(1) 软件RAID
集成于服务器操作系统中,配置管理简单,成本低,所有任务均由CPU执行,导致CPU负荷重,整体性能较差。
(2) 硬件RAID
具备计算单元与I/O处理器,独立于操作系统来管理RAID配置。比如外接式磁盘阵列柜、内接式磁盘阵列卡。虽然成本较高,但使用和配置更灵活,能够提供更好的性能,充分发挥RAID的特点,因此应用规模更大。
(3) 软硬混合RAID
拥有RAID控制器和驱动程序,但缺乏I/O处理器,仍需要依靠驱动程序来执行任务。
PCIe形式的RAID卡的外部结构如下图所示。
RAID卡不仅结合RAID Cache,提升数据的读写和传输性能,而且提供了一些强大功能,如:
- 硬盘直通:用户指令直接透传到硬盘。
- 硬盘节能:允许硬盘在空闲时停转。
- 数据掉电保护:提供超级电容进行供电及电量校准。
- 热备份:提供热备盘自动替换故障盘,未设置热备盘时则自动使用空闲盘替换故障盘。
- 一致性校验:定期计算数据并与对应的冗余数据进对比,若不一致将自动修复并保存错误信息。
4. 总结
随着硬盘接口和处理器等技术的逐步发展,RAID技术日渐成熟,凭借其大容量、高性能、可靠可控等优势,广泛应用于中大型数据库、高性能计算、互联网应用等领域,满足广大企业用户对数据存储容量、I/O性能、数据安全性、业务连续性等多方面需求。
目前,关于RAID已涌现了负载均衡、故障检测、隔离恢复等许多技术,期待未来能够迸发出革命性的新技术,推动RAID的长足进步。