人类最不可抗拒的就是大自然的力量,台风、海啸、泥石流、地震、火灾等,当他们中的随便一个发生时,都不是我们能够承受的,当然还包括一些突发的意外事件,如爆炸。这是近期发生的一件大事,但是在这里我不想多说,愿逝者长已。在这里主要想提到的是如何在灾后保全数据中心,因为每次灾难过后的数据中心多少都会留下遗憾。
数据中心是全球协作的特定设备网络,是企业业务系统与数据资源的有机组合,它的作用不可小觑!一旦灾害发生时,我们的数据被迫中断,那么数据的丢失几乎是不可避免的,损失也将大到无法预估。
回顾往昔,发现类似的事件还真是不少:
2008年3月,美国,火灾
结果: 威斯康辛的数据中心遭遇大火烧毁75台服务器、路由器和交换机等设备,引发大量站点瘫痪,历时10天得以修复。
2009年9月,土耳其,洪水
结果:伊斯坦布尔遭遇的暴雨,进而引发洪水,Vodafone数据中心遭殃,大量手机用户因该数据中心被淹而无法使用通信服务。
2010年,澳大利亚,暴雨
结果: Datacom主机代管中心的天花板被暴雨冲毁,服务器、存储和网络设备都遭损坏。
2011年3月,日本,地震
结果: 日本8.9级大地震,引发的海啸影响了日本东北部沿岸地区。许多公司在那一带建设的数据中心受到了破坏。
2012年10月,美国,飓风
结果:飓风桑迪袭击美国东海岸,支持着当地工业园运转的数据中心在飓风中因断电而瘫痪,造成了巨大损失。
2013年1月,加拿大,故障
结果:TSS的一个数据中心故障崩溃,导致Visa卡暂停服务,促使加拿大人民无法进行网络交易,给当地金融业带来了巨大损失。
2014年5月,美国,爆炸
结果: 美国德克萨斯州的一家名为ThePlanet H1的数据中心,电力短路引发爆炸,一举停摆9000台服务器
2015年,天津,事件
……
如果有组织,提前计划,及时关闭数据中心设施,结果肯定是令人欣慰的,但是面临突发状况时,根本来不及多想的情况下,一套具备可操作性的关闭计划就显得尤为重要了。
现在,自然灾害的发生越来越频繁,而且破坏性越来越强,突然事件也是接二连三,因此,灾备中心的建设是十分重要的。今年1月10日,由华为、北京邮电大学、中治研国际信息技术研究院和中国邮政存储集团联合发起的 “灾备技术产业联盟”在北京的成立,也预示着政府、行业、企业都已经认识了灾备的重要性,以及灾备的价值。
那么关于灾备有什么技术手段得以实施呢?
目前数据中心整体灾备技术可以分为以下五种:冷备、暖备、热备和双活、多活。
但是随着发展,冷备技术,已经越来越无法适应数据中心高要求的发展,逐渐成为一种淘汰的技术方式,而暖备技术工作效果也不是很理想,因为它是手工方式运作,需要人员24小时值守,热备技术相比暖备是实现了整体自动切换,但是比起双活技术来说还是逊色一筹。双活技术可以实现主备数据中心均对外提供服务,正常工作时两个数据中心的业务可根据权重负载分担,没有主备之分,当一个数据中心出现故障时,另一个数据中心将承担所有业务。而多活技术的***特点是业务在多个数据中心上同时运行,当一个或多个数据中心故障时,其他数据中心将自动接管所有应用业务,在具体实现上,多活技术部署了很多检测故障的方式,如:ICMP Monitor、TCP Monitor、HTTP Monitor、FTP Monitor,还可以实时检测服务器的运行状态、服务器负载均衡情况等,其***特点即是不会造成数据中心的资源浪费,显然多活比双活可靠性更高,但投入成本也会相应变高,实现技术也更为复杂。但是,现在在金融行业、互联网行业的数据中心更多愿意采用的还是多活技术,因为稳定性是最重要的。
进入云计算时代,灾备与云服务相结合也是一条值得探索的新路。新崛起的国内灾备厂商英方软件刚刚发布了英方云,其产品特色包括:字节级数捕获,实时复制,连续数据保护,帮助用户恢复历史数据,加密/压缩传输,确保数据安全等,在灾备云服务方面也是一个有益的尝试。
当然数据中心的选址也是很重要的,远离危险区域很必要(地震带、港口、机场、易燃易爆区等),大自然不可抗,突发事件不可避免,那么我们能做到的就是防患于未然,全面部署,以积极应对灾害给我们带来的损失,灾备计划~你的数据中心准备好了吗?