除管理存储性能以及容量以外,数据存储管理员通常需要想方设法保护其管理的数据。在过去,这只需要将输出数据拷贝至一个或多个存储媒介——其他楼层的另一台阵列(以防护小范围的设备故障)或是会运送到离线站点的可移动媒介,又或者是广域网上的另一端连接的存储(来预防更广地域范围的中断事故)。但是随着时间推移,业务产生的数据量不断递增,存储数据所用的磁盘阵列不断激增,单纯设定并遵照一系列数据保护指南变得越来越复杂,具有挑战性而且非常昂贵。
数据保护的有效性是一项衡量管理员应对快速增长的数据保护能力的指标:为每个字节设定了适当的数据保护方式,通过测试并验证其数据保护技术的应对能力,并以预算允许的方式提供"深度防护".以下列出五项可以实现更高效地数据保护成效的途径。
数据保护指南1:放弃"糟糕的磁带"的固有思维
你应当避免轻信来自于磁盘阵列厂商有关"磁带已死"的论调。自从上世纪九十年代末由磁盘阵列厂商所发起的声势浩大的市场活动不断推动用磁盘替换磁带这一方式,例如具备重复数据删除功能的虚拟磁带设备,并且这似乎已经成功的撼动了购买者的观念和采购策略。
引用行业分析的***报告:在2011年中部署的20EB+的外部磁盘存储中,超过半数的容量用以作为另一半的拷贝。在许多企业中,基于本地局域网(LAN)的镜像数量不断增加,原因就是通过基于WAN的数据复制技术,一项完全基于磁盘的数据保护方式,被阵列厂商吹捧为21世纪的数据保护之道。
虽然阵列到阵列镜像和复制技术对于某些数据而言确实是一种合适的数据保护方式,但并不适合于所有的数据。该结论源自这一事实:数据从支持应用和最终用户的业务流程中继承其重要性。而并非所有的业务流程都"总是"要求故障切换式的恢复策略,这是一种最为昂贵的恢复方式。基于WAN镜像似乎提供了很好的保护,但即使这样,这也不是绝对安全的数据保护方式。(见下文)
而从另一方面讲,磁带备份提供的有效性意味着其可以很好地保护那些不要求"总是"在线的服务。相比简单地将应用程序重新指向基于磁盘的存储,从磁带中恢复数据可能确实要花费更长的时间,但其大幅降低了成本,并且在许多情况下更为可靠。聪明的数据存储管理员会对镜像的阵列进行磁带备份,因为每年磁盘的故障率大致在7%到14%之间。数据保护通常需要混合的技术。
数据保护指南2:别幻想着基于WAN的复制技术
基于WAN的磁盘到磁盘复制策略只适用于消除了恢复时间目标(RTO)和恢复点目标(RPO)的无差异数据。而只要数据通过共享网络线路传输超过18公里,生产数据中心的数据状态同恢复数据中心的数据镜像之间的差异就一定会存在。
这其中的一部分应当归因于距离所产生的延时——通过WAN连接你可以多快地传输数据。据估计数据传输每隔100公里(62英里)的SONET连接,远程阵列距主站点的延时大约为12次SCSI操作。这是光速原理中的基本现象,我们可无法突破爱因斯坦的这一理论。
除了距离延时所造成的差异,还有"延迟抖动",即由使用共享网络服务所产生的延迟。延迟抖动的影响可大可小,取决于主站点和备份站点的距离。尽管 WAN传输有标准速率,不过一家加利福尼亚的公司在开发位于硅利康峡谷附近一个站点的数据复制方案时发现传速速率的不可预知性,变化范围从几秒钟到几个小时不等——这是由九家运营商网络之间互相路由所导致的。