IT企业数据中心管理者如何应对自然灾害?

译文
运维 系统运维
如今气候变化所引发的沿岸洪涝灾害已经成为不容忽视的问题;而在伦敦和德国,冬季的天气似乎越来越差,少量电气设备在受冻之后导致严重的组件故障。作为IT企业数据中心管理者要如何应对气象学家们口中所谓百年一遇甚至五百年一遇的风暴、洪水以及沿岸地区的其它自然灾害?

【2013年7月18日 51CTO外电头条】关于气候剧变的各种征兆接踵而至,并迫使很多企业领导者及IT专业人士思考这样一个问题:数据中心管理者要如何应对气象学家们口中所谓百年一遇甚至五百年一遇的风暴、洪水以及沿岸地区的其它自然灾害?

[[77643]]

一些专家建议关键任务数据中心的管理者们只需简单对现有设施进行加固,但另一些观察家们认为数据中心需要被转移至高地位置,第三种意见则劝说数据中心管理者综合以上两种方案。

不过专家们在这一结论上达成了一致:几乎没有几家IT机构有能力在风暴侵袭下全身而退或者仅略受影响--即使是那些长久以来一直筹备应对之策的机构也做不到。大多数IT领导者都希望以成本最低、工作量最少的方式构建灾难应对机制。

举例来说,就东海岸的情况看,各数据中心在对抗飓风桑迪时并未能拿出任何特别有效的措施,PTS数据中心解决方案公司创始人兼总裁Peter Sacco指出--这是一家位于新泽西州富兰克林湖的数据中心设计及管理咨询企业。从另一个角度看,他认为目前大部分计算机都已经成为网络体系中的一部分,而不再强调单一数据中心的重要性。

作为IT基础设施托管企业,英特奈普公司对风暴过后危险性最高的多套设施进行了加固,包括位于曼哈顿下城区百老汇街75号的建筑。在这场风暴中燃油泵出现故障,英特奈普的员工们不得不将巨大的1200加仑燃油桶运送至楼上,从而保证服务器的电力供应。

“没人准确预测到桑迪竟会带来如此巨大的灾难,”英特奈普公司开发与运营部门高级副总裁Steve Orchard表示。通过飓风桑迪与2011年的飓风艾琳,“这种趋势已经给我们敲响了警钟,”他补充称。

该公司已经宣布将在新泽西州的斯考克斯市建立新的数据中心--远离冲积平原。“我们非常重视气候变化因素,并以此指导自己对新设施的位置选择,”Orchard解释道。

背景情况

2005年的飓风卡特里娜与丽塔给我们留下深刻印象,紧随其后的是2008年的古斯塔夫与艾克,接着是2012年的艾萨克。一波又一波的灾难在墨西哥湾沿岸给Entergy公司的IT管理者带来了巨大压力。这家市值100亿美元、拥有15000名员工的企业最终放弃了在新奥尔良地区建立数据中心的打算。

在卡特里娜出现之前,向280万客户提供核能与矿物燃料电能供应的Entergy公司将总部设在新奥尔良,并在路易斯安那州的格雷特纳建立起一家数据中心--位于密西西比河与新奥尔良市区之间。

“我们当时获悉数据中心正好处在风暴前进路线之上,巨大的压力让我们在灾难结束后旋即做出决定--对数据中心进行迁移,"Entergy公司CIO Jill Israel回忆道。"我们数据中心周边的区域并未直接受到洪水侵袭,但电力供应已然中断,外部线路损坏使我们不得不使用备用发电机并关闭了大部分设施。”

2006年冬季,该公司决定在密西西比州的杰克逊市与阿肯色州的小石城建立两家镜像数据中心。在小石城方面,该公司对一家历史悠久的图书馆进行了结构改造,并于2008年陆续将来自新奥尔良的硬件及关键性应用迁至这套备份设施当中。

直到2010年,Entergy才最终完成了这套耗资3000万美元的杰克逊数据中心。该公司需要对两套设施进行负载平衡,尤其是电子邮件系统。根据Israel的说法,"将应用程序由新奥尔良迁出需要制定一套周密的规划方案。继卡特里娜之后,我们已经遭遇过多次严重风暴灾害,包括小石城遭遇的冰风暴。不过我不希望再被自然之力吓得心神不宁,"她告诉我们。

该公司每年都会针对飓风及其它类型风暴灾害进行演练,从而获得更出色的应急响应能力。Israel不无自豪地声称,“我们很快意识到如何高效将劳动力进行分散非常重要。我们的员工现在能够以远程方式处理大量工作,而且其实际效果相当出色。”

不过并非每位管理者都对自然灾害保持密切关注。位于欧洲及美国东北部的众多IT机构似乎坚持认为,超级风暴只是自然界难得一遇的小概率事件。在某些情况下,即使已经受到灾害的实际影响,IT管理者仍然表现出严重的健忘症、拒绝对状况做出积极回应。#p#

无知者无畏

“从传统角度看堪称高枕无忧的方案如今很可能面临威胁,”Gartner公司数据中心及基础设施分析师Rakesh Kumar指出。他列举了发生在欧洲地区的冻结温度、沿岸洪水及其它一些无法预测的气象变化,并强调了亚洲地区对于海啸活动的漠视。“直到真正遭遇大规模数据停机事件之前,大部分客户对于自然灾害引发的风险并不关心;他们甚至有点选择性无视的意味,”Kumar解释道。

他表示大部分欧洲及美国客户都乐于进行长期风险评估并采取前瞻性评估机制,至少在理论层面是如此。

即使是在飓风桑迪刚刚过去数个月的今天,大部分东海岸企业仍然没有组织数据中心迁移的计划。“他们不仅没有考虑迁移事项,甚至希望在原有基础上进一步扩大数据中心规模,”希恩合作公司数据中心架构负责人Neil Sheehan指出--这是一家位于芝加哥的架构企业。

他认为,事实上“我们正在为客户在新泽西周边海岸地区制定扩展方案。”Sheehan表示,根据对五百年一遇洪水的水位调查,数据中心架构师可以设计出理想的一层高度从而在灾害发生时依靠多层停车场容纳积水。

也有不少企业在口头承诺之外对可能出现的灾难做出进一步准备。在曼哈顿下城区西街140号,一家Verizon交换中心也彻底感受了一回飓风桑迪的真正威力。洪水一口气淹没了五层地下设施,包括Verizon电缆室。技术人员不得不努力在电梯井处安装应急发电机与抽水泵。

自灾难发生以来,Verizon公司已经从曼哈顿下城区的基础设施、中央办公室、总部以及客户现场中撤出150吨受损铜缆,并利用防水光缆作为替代。“如果大家使用的是光缆,那么即使将其铺设在浴缸里也不会影响正常使用;光纤材质并不怕水,”Verizon企业解决方案部门全球客户保障副总裁Chris Kimm表示。

通过更换电力基础设施并将其提升至较高楼层,这家运营商最终得在一周之后恢复了中央办公区的正常运作。

不少客户开始纷纷仿效Verizon的应对之策--将关键性基础设施迁移至封闭化可租用办公位置。根据Kimm的见闻,有些客户还会部署一系列新服务,包括移动无线、无线IP以及云计算方案等,借以帮助员工以远程方式处理日常工作。另一些客户会重新部署其电信及数据网络。“我们甚至要求一部分楼宇业主将原本的企业场所改造为住宅环境,并全面部署无线服务,”Kimm指出。

即使遭受了如此严重的灾害侵袭,Verizon仍然不打算将交换中心迁移至洪水发生频率更低的位置。相反,Kimm认为“我们正在提高建筑物的抗灾能力;我们已经对所有潜在风险做出了评估。尽管目前还没有制定出最终方案,但……在飓风季节来临之前,我们还不会遭遇太严重的潜在风险。”

经验教训

由飓风卡特里娜与飓风桑迪这样的极端状况所引发的气候变化仍然难于计算,气象学家们甚至无法准备预测终端天气、海平面及温度上升的具体情况。不过在美国本土,例如曼哈顿、长岛、新泽西、迈阿密、波士顿、华盛顿特区甚至是西雅图与圣迭戈等地,未来的沿岸洪灾很可能会越来越多。

“我认为近年来接二连三的风暴令人无法忽视,统计结果也显示全球气候变化及其它因素正引发越来越多的极端天气状况,”451研究公司业务连续性与弹性分析师Jim Grogan指出。

“不过每一次自然灾害都给我们带来可资学习的经验,”他表示。“经验来自数据中心运营商们为了在最糟糕条件下继续保持设施运作而做出的创造性及创新性努力。”

尽管桑迪的出现为众多浑浑噩噩的纽约数据中心运营商敲响了强化基础设施的警钟,不过目前尚不清楚多少措施能够真正成为长效性解决方案--例如彻底脱离城市环境、部署冗余及地理位置彼此独立的设施或者采用第三方灾难恢复及云计算解决方案等。

Grogan同时宣称,某些大型IT机构正在为数据中心运营寻找备选地点。“亚特兰大、弗吉尼亚以及其它地区的多租户数据中心运营商已经意识到客户将基础设施向东北部迁移的需求。”

很多有能力负担灾难恢复方案的企业都考虑在主要城市之外使用Cervalis等托管系统供应商的安全多租户基础设施。Cervalis是一家IT基础设施供应商,目前拥有超过两百家企业客户,其中包括来自世界各地的银行及软件公司。Cervalis在纽约州北部、新泽西州赛克郡以及康涅狄格州的费尔菲尔德郡都拥有占地数十万平方英尺的多租户设施,且远离洪水可能侵袭的区域。

Cervalis提供配备冗余电源的安全机柜,每个机柜能够容纳20到40台服务器,月使用费在1500美元左右。客户能够利用其设施作为主要或次要数据中心,而且根据Cervalis公司营销、销售以及业务开发副总裁Zack Margolis的说法,其使用成本低于自主创建冗余设施。

当然,并不是每家企业都有能力负担起这种级别的保护方案;某些小型运营商可能尚未意识到数据备份的重要性。不过大多数机构将必须寻求以高性价比方案确保业务连续性的方法,例如在小型灾难恢复设施中使用虚拟化云或者备份磁带等。

此外,许多企业仍然决定固守大城市。“曼哈顿的基础设施需求仍然非常旺盛,这主要是因为曼哈顿在美国本土的互联枢纽地位所决定,”451研究公司数据中心托管分析师Michael Levy指出。另外,金融企业希望计算设施与交易事务中心尽可能临近,从而保证数据处理始终被控制在低延迟状态下。不过这基本是一种误解,事实上由光纤连通的不同设施即使相距很远也能带来理想的延迟状况。

总体而言,Kumar坚持认为IT领导者在天气与气候变化方面采取的处理态度与重视程度还远远不够。“如今气候变化所引发的沿岸洪涝灾害已经成为不容忽视的问题;而在伦敦和德国,冬季的天气似乎越来越差,少量电气设备在受冻之后导致严重的组件故障。”

尽管铁一般的事实已经摆在面前,大多数IT管理者仍然拒绝主动做出风险评估以避免灾害困扰。“每当Gartner公司谈到风险评估,客户们总会表示‘很好,我们会与工程部门联系整理出一份报告’”,Kumar告诉我们。“但两个月之后,事情往往仍没有任何实质性进展。”

原文链接:

http://www.pcworld.com/article/2044401/some-data-center-operators-take-their-chances-with-floods.html

责任编辑:黄丹 来源: 51CTO.com
相关推荐

2017-08-15 15:13:45

数据中心自然灾害

2010-07-01 21:30:14

数据中心应用交付Radware

2022-12-15 14:48:47

2020-11-10 06:08:55

人工智能物联网自然灾害

2015-10-14 15:12:07

数据中心管理者

2010-02-25 15:59:36

数据中心惠普

2012-02-27 09:39:11

数据中心大数据

2009-10-13 10:37:14

自然灾害应急预案

2018-07-01 16:00:20

2020-02-10 14:28:03

数据中心基础设施IT

2019-08-26 11:39:43

存储

2018-03-13 07:11:45

数据中心自主管理数据中心IT

2023-12-01 18:03:52

2013-08-22 15:03:18

2018-03-08 16:53:21

数据中心数据海啸

2011-01-10 09:19:23

数据中心网络管理服务器VMware

2023-07-04 07:23:37

数据中心WUE管理

2021-08-04 12:28:11

数据中心能源绿色挑战

2011-09-20 14:48:13

云计算数据中心自然灾害

2022-10-09 10:24:17

自然灾害人工智能AI
点赞
收藏

51CTO技术栈公众号