10月12日银监会下发的【2015】162号文件又一次将银行信息系统的灾备问题推向了风口浪尖。文件指出:“今年5月8日,某城市商业银行核心系统数据库发生故障,数据库自动存储管理(ASM)文件异常损坏,数据库无法加载存储磁盘组,导致数据库服务器宕机,灾备中心无法正常使用,造成该行柜面和渠道业务较长时间的中断。”
仔细阅读文件,我们不难发现此城市商业银行并非缺乏相关灾备的解决方案,相反其同城灾备数据中心甚至采用了IBM Metro Mirror存储级数据复制技术,搭建起同城存储“双活”架构,号称可以实现RPO=0,RTO=0,保证业务连续性的***等级需求。
让我们先来看看什么是Metro Mirror
Metro Mirror同城存储复制技术(以前也被称为PPRC),是以存储为基础的、实时的、与应用无关的数据远程镜像功能。可以保证是无数据丢失且具有完全恢复功能的灾难恢复解决方案。
Metro Mirror基于IBM的企业级存储服务器,通过光纤通道,以逻辑卷为基本单位,将本地存储设备上的数据同步镜像到远端存储设备上。
Metro Mirror的同步实现机制如下图所示:
1. 在生产系统中的应用程序将数据写到生产系统的磁盘。
2. 生产系统中的磁盘数据传输到备份中心的磁盘
3. 当生产数据都写入备份中心存储设备后,备份磁盘将写完操作信息返给生产磁盘
4. 当生产系统收到灾备系统传回的已写信息之后,生产机的磁盘系统通知主机该写操作已完毕。
Metro Mirror技术能够实现RPO,RTO=0,从而做到存储双活,这话确实没有错。然而,这一结论仅限于存储设备发生物理故障时才成立。而一旦数据本身发生损坏或人为删除等逻辑故障时,同步双活只会将错误的数据一式两份,造成生产端和灾备端的存储双双“悲剧”。
解决逻辑错误的办法早已有之。快照技术可以按照设定的间隔时间,将存储数据回退至最近一份正确数据;而CDP技术更是能够像录像般记录整个IO的读写,以***的数据丢失量进行数据的“时光穿梭”。
然而,此次遭遇宕机事故的银行,虽然下血本建了存储双活,但却疏于防范“逻辑故障”这一潜在风险,最终导致了问题的发生。
柏科数据VRD虚拟化网关解决方案,在支持双活数据中心建设的同时,内建快照与微秒级CDP,有效预防物理故障与逻辑故障,真正做到全方位的灾备保护。
除此以外,柏科数据VRD虚拟化网关还支持存储虚拟化、远程精简带宽传输的复制等功能,不管是对过去架构的兼容性,亦或异地灾备的构建都能得到强有力的保障。
银行灾备系统的建设是一件复杂而不容有失的任务。选择能够全方位应对各种风险,真正保证业务高可用与高可靠的灾备解决方案,将是我国银行业信息化过程中需要着力解决的重要课题之一。