小议银行“存储双活”宕机事故

存储 存储软件
城市商业银行并非缺乏相关灾备的解决方案,相反其同城灾备数据中心甚至采用了IBM Metro Mirror存储级数据复制技术,搭建起同城存储“双活”架构,号称可以实现RPO=0,RTO=0,保证业务连续性的最高等级需求。

10月12日银监会下发的【2015】162号文件又一次将银行信息系统的灾备问题推向了风口浪尖。文件指出:“今年5月8日,某城市商业银行核心系统数据库发生故障,数据库自动存储管理(ASM)文件异常损坏,数据库无法加载存储磁盘组,导致数据库服务器宕机,灾备中心无法正常使用,造成该行柜面和渠道业务较长时间的中断。”

仔细阅读文件,我们不难发现此城市商业银行并非缺乏相关灾备的解决方案,相反其同城灾备数据中心甚至采用了IBM Metro Mirror存储级数据复制技术,搭建起同城存储“双活”架构,号称可以实现RPO=0,RTO=0,保证业务连续性的***等级需求。

让我们先来看看什么是Metro Mirror

Metro Mirror同城存储复制技术(以前也被称为PPRC),是以存储为基础的、实时的、与应用无关的数据远程镜像功能。可以保证是无数据丢失且具有完全恢复功能的灾难恢复解决方案。

Metro Mirror基于IBM的企业级存储服务器,通过光纤通道,以逻辑卷为基本单位,将本地存储设备上的数据同步镜像到远端存储设备上。

Metro Mirror的同步实现机制如下图所示:

mmexport1446012229462.jpg

1. 在生产系统中的应用程序将数据写到生产系统的磁盘。

2. 生产系统中的磁盘数据传输到备份中心的磁盘

3. 当生产数据都写入备份中心存储设备后,备份磁盘将写完操作信息返给生产磁盘

4. 当生产系统收到灾备系统传回的已写信息之后,生产机的磁盘系统通知主机该写操作已完毕。

Metro Mirror技术能够实现RPO,RTO=0,从而做到存储双活,这话确实没有错。然而,这一结论仅限于存储设备发生物理故障时才成立。而一旦数据本身发生损坏或人为删除等逻辑故障时,同步双活只会将错误的数据一式两份,造成生产端和灾备端的存储双双“悲剧”。

解决逻辑错误的办法早已有之。快照技术可以按照设定的间隔时间,将存储数据回退至最近一份正确数据;而CDP技术更是能够像录像般记录整个IO的读写,以***的数据丢失量进行数据的“时光穿梭”。

然而,此次遭遇宕机事故的银行,虽然下血本建了存储双活,但却疏于防范“逻辑故障”这一潜在风险,最终导致了问题的发生。

柏科数据VRD虚拟化网关解决方案,在支持双活数据中心建设的同时,内建快照与微秒级CDP,有效预防物理故障与逻辑故障,真正做到全方位的灾备保护。

VRD虚拟化网关-01.jpg

除此以外,柏科数据VRD虚拟化网关还支持存储虚拟化、远程精简带宽传输的复制等功能,不管是对过去架构的兼容性,亦或异地灾备的构建都能得到强有力的保障。

银行灾备系统的建设是一件复杂而不容有失的任务。选择能够全方位应对各种风险,真正保证业务高可用与高可靠的灾备解决方案,将是我国银行业信息化过程中需要着力解决的重要课题之一。

责任编辑:路途 来源: 柏科数据
相关推荐

2015-05-29 10:37:58

浪潮

2018-11-30 12:11:11

Oracle存储配置

2019-01-13 17:22:27

云计算宕机微软

2015-05-26 12:43:08

双活资源池电子银行华为

2011-05-27 09:04:39

Skype宕机

2015-06-04 13:38:17

2020-09-07 08:42:13

宕机业务运维

2016-01-04 11:18:38

存储极客

2015-07-02 12:50:41

电子银行华为

2017-08-21 21:31:16

双活戴尔

2015-05-04 16:09:54

戴尔云计算

2017-11-16 08:31:01

系统存储难点

2020-09-14 11:04:22

潮数

2018-05-30 15:45:43

华为

2013-01-06 17:40:10

GitHub宕机事故

2019-01-16 09:20:42

架构设计JVM FullGC宕机事故

2022-07-07 07:51:00

数据中心存储层脑裂

2014-05-12 09:55:56

惠普Nonstop光大银行

2015-04-28 16:29:33

2023-05-17 18:38:58

宕机认证令牌
点赞
收藏

51CTO技术栈公众号