磁盘阵列如果发生故障,其工作效用就会大打折扣,不但保护不了数据的安全,反而会使数据丢失,因此,在服务器磁盘阵列出现故障以后,一般情况下会采用两种方法来处理:一是设备厂家对故障设备进行处理及恢复,比如更换坏件、重配Raid等;二是找专业的数据恢复公司来处理,先把重要数据恢复出来,然后才进行硬件设备维修。
有个数据恢复案例硬件信息及故障如下:
由14块盘做成的HP阵列柜,其中13块盘做成Raid5,有1块硬盘是热备。14块盘的硬盘指示灯均显示绿灯正常,在操作系统中的磁盘管理界面能看到阵列盘,但都显示为不可识别的硬盘。本案例故障属于磁盘阵列(Raid)信息故障。磁盘阵列信息存储在HP阵列卡上,同时还在每个物理硬盘上存有备份。如果这两个信息不一致,或者其中一个损坏,就会出现本故障现象。
恢复方案:
方案1:重新配置或者修复Raid信息。这种方式方便快速,先查看现有阵列信息参数(磁盘顺序、块大小等),在原阵列卡上删除现有Raid信息,重新创建Raid5,配置的时候保留原有的Raid5参数。这种做法需要深入了解Raid卡,要知道阵列卡的每一个工作细节,特别注意该阵列卡在重新配置阵列的时候是否自动初始化阵列,是否破坏原有数据等等。所以这个方案具有一定的风险,但是这种恢复方式速度快,在特定情况下,需要论证该方案的可行性,如果可行就可以采用。
方案2:重新组合磁盘阵列上的数据到新的磁盘阵列上。本案例阵列卡安装在服务器上而不是在阵列柜中,我们把这个HP阵列柜挂接到一个带有SCSI接口的机器上,就能识别出14块独立的物理硬盘,这个操作不会对硬盘有任何的数据破坏。从14块独立的硬盘中分析出Raid5的数据组合方式(块大小、数据走向、硬盘顺序等),得出详细的组合参数以后,用“护航舰”Raid重组工具把Raid5的数据组合到新的磁盘阵列柜。本案例中单个物理硬盘容量300GB,总的磁盘阵列柜容量为4TB左右,重组数据需要花费比较长的时间,重组过程需要花费24-36小时的时间或者更长一些。本恢复方案没有数据破坏和丢失的风险,因为对原有的物理硬盘只进行读操作,但是花费的时间就长一些。
在实际恢复工程中,我们建议采用第2种方案进行数据恢复,在物理硬盘没有硬件损伤(硬盘不可识别)的情况下,方案2保证了数据100%的安全,也保证100%的恢复。方案1是在特殊条件下才能采用的,不能保证数据100%安全。
磁盘阵列的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点,但一定要用好,才能使其作用发挥到最大。
【编辑推荐】