在重大灾害性天气面前,现代科技技术往往显得脆弱无力。从台风“海燕”、“罗莎”到前不久“天兔”造访广东,多家部署在汕头的互联网企业机房受到长时间断电等严重影响。有些网站、社区因此受到严重影响,导致服务器终止一天之久,并且在电力恢复后,因服务器重启需要时间,仍无法提供服务。
此时,同样建设在汕头的腾讯云机房,却只用了20分钟便恢复运营。
腾讯云总经理陈磊曾指出,在遭遇重大自然灾害时,云服务器的容灾、抗灾能力至关重要。因机房断电导致的云服务器中断,将会对部署在云上的应用因影响了用户体验,导致用户***性流失,这个损失,对于开发者来说是致命的。
那么,腾讯云是如何做到20分钟排除故障的?腾讯T4技术专家吴悦表示,在容灾抗灾方面,腾讯云做了大量的工作,可以快速应对故障。
他告诉记者,面对自然灾害时,针对可能出现的电力中断风险,腾讯云会对IDC备用发电设备进行检查,评估燃油储备,保障电力供应。针对可能出现的网络中断风险,准备流量绕行方案。“腾讯云的备用发电机,会在电力出现故障的时候,帮助我们随时上线,保持电力不中断。“吴悦如是说。
在天兔肆虐之时,正是这些抗灾预案,使腾讯云机房出现电力故障的时候,***限度保障了开发者的业务。
因自然灾害引发服务器中断后,如何***程度上保障用户数据?这需要云计算提供智能的数据备份机制。腾讯云北京研发中心总监郑立峰告诉记者,根据腾讯云实际运营数据,腾讯云提供的热备、冷备机制,还有binlog流水恢复机制,可以保证开发者数据不会丢,数据安全性可达99.999%。
同时,灾害导致的故障发生后,云服务器面临的有可能是几百倍的访问流量,这使云计算受到更大的考验。腾讯云的负载均衡能力,可将暴增的用户动态地引导到不同的服务器上,防止单个服务器因压力过大崩溃。而其分布式存储,将数据风险尽可能地降到***点,并可以根据访问的量进行动态的扩展。
经此一役,显然容灾、抗灾能力,已成为衡量云计算服务质量的不可忽视的标准。云服务商增强对自然灾害、网络故障等方面的预警能力,完善应对预案,是云服务商不可推卸的责任。腾讯云此次以20分钟恢复云服务,或许已悄悄地成为云计算行业,在容灾能力方面的标杆。