DR Rapid:打通备份数据流动的任督二脉

云计算 虚拟化
近日ESG发布了一份实验室报告《Dell DR Series Appliances with OS 3.2: Performance, Security, Scalability, and Interoperability Enhancements》,评测对象是软硬件升级后的戴尔DR系列磁盘备份设备。

近日ESG发布了一份实验室报告《Dell DR Series Appliances with OS 3.2: Performance, Security, Scalability, and Interoperability Enhancements》,评测对象是软硬件升级后的戴尔DR系列磁盘备份设备。

 

 

产品主要更新:➀针对新的和已有数据的静态加密;

➁通过NDMP和iSCSI备份到虚拟磁带库(VTL),每个设备可以支持4个VTL容器;

➂性能升级。增加50%马力(DR6000更新到Ivy Bridge处理器,现在是12核/CPU)缩小备份窗口并加速恢复同时支持加密任务;

➃扩展性改进。DR6000现在支持在扩展柜中的6TB磁盘,提升RAID 6之后的总可用容量40%,从180TB达到252TB。这个可观的密度——在10U机架中252TB——带来了电源、制冷和管理方面的成本节约。

另外,配合DR2000v Hyperscale虚拟设备,最多3,000个DR2000v可以被授权到一个物理DR设备。

先重删/压缩,再加密这里需要解释一点,就是如果先对数据加密,再做重复数据删除和压缩就没有效果了,无论你是定长还是可变长切块,因为数据中的规律在加密时完全被打乱。以传统磁带设备来说,压缩和加密是不能同时做的。如果备份软件做完重删再将数据写到磁带不是不可以,但通常这样使用的不多,因为在恢复时需要相同的备份软件环境、元数据和指纹库。戴尔DR系列目标设备是在备份写入时先做重删和压缩,再进行加密;读取时自然是先解密再“水化”复原数据。

 

戴尔DR系列的核心技术,主要来自于2010年收购Ocarina的压缩和重复数据删除技术,也就是上图中我们圈出的左上角——后来还增加了DR Rapid源端重删加速技术(类似赛门铁克OST和EMC DD Boost)。而右边列出的“支持2.5亿个文件”就属于它文件系统的扩展性了。性能影响测试

ESG通过测试来验证加密对性能的影响,首先是单纯的目标端重复数据删除。除了CIFS和NFS两种标准文件协议之外,RDA是戴尔专为DR系列和NetVault备份软件通信而设计的专用协议,这里只用了Passthrough直通模式,没有打开其源端重删。

 

可以看出,仅做目标端重删时打开加密的性能影响是很小的。RDA协议的优势不小,我觉得它基本上可以替代传统跑在FC网络上的LAN-Free备份了。

 

上图引用自ESG实验室在去年5月的另一份报告:《Enterprise-class Backup Performance with Dell DR6000》

 

戴尔DR Rapid技术的一大特点是开放兼容。如上图:除了所有DR支持(也就是做过兼容性测试)的备份应用都可以使用标准NFS/CIFS做目标端重删之外;针对NetVault有自己的RDA;赛门铁克Backup Exec和NetBackup可以用OST协议;对于CommVault、TSM、NetWorker、RMAN等更多备份程序还提供Rapid CIFS/Rapid NFS插件,同样支持源端+目标端全局重复数据删除。

报告显示:“全新协议加速器Rapid NFS和Rapid CIFS(属于戴尔DR Rapid技术插件)是业内首创的源端技术插件。经测试,这些插件的备份处理性能可比传统NFS/CIFS备份高三至五倍。”

 

在打开源端重删之后,加密对性能的影响在DR4100上相对明显一些,但Rapid CIFS是个例外。ESG认为DR6000硬件配置更高所以计算资源充足些。源端重删将数据的Hash指纹计算和初步比对放在客户主机或者备份服务器上完成(可参考下图),而发送到DR设备后还要在全局指纹库比对,然后传送唯一数据块并压缩,所以DR在加密之前的处理也是不少的。

 

与前面一个图表比较,打开源端重删之后的备份吞吐性能基本在15-20TB/小时的水平,比单纯目标端重删确实提升巨大。

DR Rapid参考架构

上图是DR Rapid源端重复数据删除的一类部署方式。由于用的是NetWorker备份软件,配合DR6000重删的服务器安装Rapid NFS/Rapid CIFS插件,只有控制元数据会发送到NetWorker备份服务器。

 

有的厂商在宣传***性能数字时,有意无意回避“DD Boost”这类技术带有的源端重删特征,在另外一些同行眼中那些数字则有“作弊”嫌疑。而我们则认为应该正视源端重删技术,运行插件消耗一部分计算资源是客观存在,但如果按常用的每天一次闲时备份,且服务器利用率允许的情况下也可以忽略这种影响。毕竟只要备份就可能有影响,何况源端重删还能节省网络带宽,所以用户根据自己实际情况来选择就好了。还有一点可变因素就是测试的数据样本,不同类型/重删率的数据产生的加速效果也有不同。

如果不愿消耗生产服务器的资源,也可以将DR Rapid插件安装在备份服务器上,配合DR系列进行另外一种“源端”去重。这种情况下会增加备份服务器的压力,客户端到备份服务器的网络流量不会减少,必要时可增加介质服务器来提高并发。

 

上表是ESG去年报告里的测试结果,可以看出有些环境下Rapid NFS甚至能达到比RDA略高的性能,而OST和Rapid CIFS也相差不多。打开源端重删按照20TB/小时计算相当于5.8GB/s,关闭源端重删按照5TB/小时也有1.4GB/s。DR4100比DR6000的性能要低一些,但也能满足大多数中小规模用户的备份恢复需求了。

 

总之,我们认为DR Rapid相对于同类技术的***特点就是开放兼容、采用最便利的方法来与各种流行的备份软件适配。当您受困于备份/恢复速度,或者服务器与备份存储之间的网络瓶颈时,不妨尝试下戴尔DR系列来帮您打通这个数据流动的“任督二脉”吧!

责任编辑:老门
相关推荐

2021-02-26 21:59:22

Git版本系统

2016-10-20 09:29:38

云极星创云计算

2021-04-20 19:20:57

Kafka架构设计

2010-05-04 17:58:22

云计算

2018-01-26 09:37:04

DBAMySQL架构

2009-06-24 15:21:00

路由器下载速度

2013-10-28 15:29:49

数字家庭三网融合

2016-02-22 14:28:52

2010-12-20 15:00:43

2014-04-01 09:31:47

打通任督二脉:用友NC

2018-08-13 18:13:00

大数据

2010-05-20 11:30:47

OA协作平台宝时得鼎捷软件

2019-01-07 19:49:31

Oracle NetS一体化管理

2021-12-13 07:02:47

硬件软件CPU

2009-09-18 14:03:24

IT运维

2021-06-10 07:49:27

Kafka 架构设计

2020-05-20 14:41:11

微软机器学习Windows

2024-11-04 08:00:00

2020-12-15 10:46:29

事件监听器Spring Boot
点赞
收藏

51CTO技术栈公众号