移动互联、云计算、大数据使得企业面临着结构化与非结构化数据并存的系统场景;同时,企业业务越来越不能忍受系统故障,例如金融等行业,业务中断一小时意味着数百万美元的损失。在这样的需求背景下,一体化双活数据中心方案应运而生。
各行业每小时停机造成的损失
一体化双活的诞生
数据高度集中的传统数据中心所面临的风险和威胁非常多,故障影响范围变得越来越广。主备数据中心是一个主流的容灾方案,业务部署于其中一个数据中心中,而另一个作为备用,当主数据中心故障,管理员需要将业务迁至备用数据中心上。系统故障后业务恢复操作复杂,中断时间长。对于分秒必争的企业来讲,这是无法容忍的。
而双活数据中心不再单一的从提高系统组件高可靠性上思考,而是从业务连续的角度,高效利用网络资源、计算以及存储资源,设置两个数据始终一致的数据中心,为上层应用提供服务。如此一来,当其中一个站点发生故障,另一站点仍然能够继续为业务提供服务,端到端实时可用,容灾切换也是自动实现的。
早期的双活数据中心以SAN双活为主,其中又有网关和阵列双活等实现方式,随着NAS的发展,NAS双活也成为双活数据中心的一个重要分支。事实上,以医院为例,对HIS和PACS信息系统的依赖加大。HIS信息系统的数据库数据采用SAN保存,而PACS系统的影像文件采用NAS保存。针对同时要求数据库与文件关键业务存储系统同时高可用的需求,所以需要融合SAN双活和NAS双活于一身的双活数据中心,才能保障业务连续。
华为HyperMetro SAN与NAS一体化双活解决方案
针对医院、制造、政府等行业客户要求数据库与文件关键业务存储系统同时要满足高可用的需求,华为推出HyperMetro SAN与NAS一体化双活解决方案,为数据中心关键业务提供7*24小时服务保障。
华为HyperMetro SAN与NAS一体化双活解决方案
华为一体化双活解决方案,具有浑然一体和化繁为简的两大特点
- 华为的一体化双活解决方案设计可谓浑然一体:一台设备+一套仲裁+一种网络就可以搞定
首先是一台设备。借助OceanStor V3融合架构,华为一体化双活方案采用免网关的架构,一台设备即可同时提供SAN和NAS双活服务。设备数量减少2台以上,同时提升了系统整体性能。
其次是一套仲裁。共用一套仲裁,统一的仲裁机制确保仲裁结果始终一致,从而保证SAN和NAS同时在一套设备上提供服务。这一设计规避了传统双活方案两套仲裁机制在站点间网络故障后,出现仲裁结果不一致的问题。
***是一种网络。仅需要一种网络(IP或者FC)就可以满足站点心跳、配置、复制链路等需求,此外,业务网络、站点间网络以及仲裁网络均可以使用IP进行部署,组网和网络管理操作简单。
- 化繁为简的一体化双活方案:升级、恢复和扩展都很简单
升级简单:可实现单套设备在线平滑升级到双活,甚至扩展到两地三中心,提供更高级别的数据保护服务。
恢复简单:支持自动恢复双活关系,当故障设备修复后,无需人工进行干预即可恢复双活关系,实现运维自动化。
扩展简单:***可在线扩展至32节点,满足客户业务不断增长的存储性能诉求。
那华为一体化双活方案SAN和NAS的读写流程是怎样的呢?是如何做到数据一致性的呢?让我们详细剖析一下。
SAN的读写流程
下图展示了一个I/O的处理流程。主机下发I/O到双活管理模块,系统记录日志。之后双活管理模块将I/O同时写入本端和远端Cache并收集两端Cache的写处理结果。如果写成功则清除日志,如果失败,日志则转换成为DCL(Data Change Log)并记录本端LUN与远端LUN差异。
一体化双活写请求流程(LUN)
与SAN的写操作类似,文件的写则是将写请求先下发到文件系统,文件系统再将请求下发给双活管理模块。在HyperMetro收到双端Cache写请求结果之后再将结果返回到文件系统。
正常情况下,任意应用I/O都需要同时写到两端阵列才能返回主机,确保两个数据中心的数据实时一致。当其中一端写I/O异常,那么双活管理模块会通过DCL进行记录,站点修复之后再依据DCL将数据增量写入存储。整个过程无需人工进行干预即可恢复双活关系,实现运维自动化。
一体化双活写请求流程(FS)
为了保障双活数据中心的数据始终一致,设计了分布式锁机制(DLM),一方面任何控制器访问数据之前都需要申请这个全局的锁,另一方面其他控制器无法对存在锁保护的地址进行访问操作,这就保障了同一地址上的数据不会出现访问冲突。
单点故障时,另一站点会自动接管所有请求,如果仲裁服务器故障,系统也会自动进入静态优先模式,所以不会影响业务;双点故障较为复杂,在仲裁服务器、优先站点、非优先站点以及三者之间的链路出现双点故障时,系统同样会通过静态优先等方式继续为应用提供服务,大部分双点不会影响业务连续性。
华为一体化双活方案可以实现大部分的非典型故障自动恢复,用户无需进行过多配置操作。
分布式锁机制(DLM)
在比利时Saint-LUC(UCL)医院,华为为客户提供300公里内的端到端双活数据中心解决方案,确保业务系统发生设备故障、甚至单数据中心故障时,业务自动切换,上层应用无感知,确保业务永续。
随着企业业务复杂度的不断提升,业务中断和数据丢失的风险越来越大。华为一体化双活解决方案,可以确保数据库与文件业务实时在线,并且通过统一管理平台实现了简易运维。更为重要的是,不论单点故障还是双点故障,都能够***限度的缩短恢复时间,通过充分的自动化设计提高系统恢复效率,全面保障企业业务永续。目前,华为一体化双活解决方案在金融电子影像、公安警务综合系统、检察院电子检务等场景下均有着广泛的应用。
全文结束--