【51CTO独家】2011年11月17日下午5点左右开始,51CTO网友反应傲游浏览器无法登录傲游服务器,在线收藏夹等功能无法使用。截止到记者发稿时傲游浏览器已经恢复用户登录。同一时间出现问题的不只是傲游,豌豆荚、新浪邮箱服务、爱词霸、还有一些网络游戏的在线服务同时中断。本次事件是由于塘沽运营商核心机房在进行电力维修时,世纪互联机房电缆被铲车挖断。预防机房断电本应该是IDC应急预案中相当重要的环节。但是为什么此次断电却持续了这么长时间呢?为什么我们的机房如此脆弱?那么IDC机房到底是怎么了呢?
他停完了22年的电
本次停电时间从11月17日下午5点开始一直到18日上午10点左右服务陆续恢复(豌豆荚18个小时、爱词霸17个小时、傲游18个小时),停电总时长约为18个小时。
对于此次事件51CTO记者联系到知名IDC森华通信的执行总监洪雷先生。洪雷先生告诉记者:“电力保障要求需要达到四个9标准,每个机房每个月的断电时间不能超过99.99%,也就是每个月最高断电时间不能超过4分钟。”
按照数据显示每个机房每个月断电最长不能超过4分钟算,一年不能超过48分钟,经过简单的数学计算,18个小时的断电意味着未来22.5年间这个机房不能出现一分钟的停电故障。他已经把22年的电停完了。
洪雷先生谈到IDC机房电源时说到:“作为一个合格IDC机房,必须具备从不同发电站对点接入的双路市电,并且需要具备6小时UPS电力保障与柴油发电机的无缝衔接。”洪雷先生还补充到,IDC机房需要和周边加油站协商燃油供应,并且每个月启动一次柴油发电机,这样一来是测试设备是否可以使用,二来是可以掌握设备的使用数据,在发生断电故障的时候可以灵活处理。在谈话中洪雷先生反复强调,电力对于IDC来说就像人的血液一样,血液供应无法保障那么这个人也就Over了。IDC必须提高对自身的审核尽最大努力为用户提供安全放心的服务。
一个合格的IDC机房需要做到哪些标准
目前对于IDC机房的审核标准主要从电力、温度、湿度、网络以及备份几个方面上。对于如何选择一个合格的IDC机房,其实广大运维都知道,在IDC机房内部温度上需要控制在23°±2之间;湿度需要控制在A级45%-65% 、B级40%-70%上线浮动不能超过±5%。
当然网络备份也是十分重要的,网络需要达到三个九标准,每个机房每个月需要保障99.9%的网络通畅时间,也就是说每个机房每个月的断网时间不能超过44分钟。作为一般机房而言,需要进行双链路备份有必要的话需要进行三链路备份,即时一条链路的路由出现问题也能马上切换到另一条链路上。
一般机房在温度与网络上都会达标,因为用户可以非常直观的检测到,但是对于电力方面用户是无法进行实质性的测试的。
洪雷先生认为:“就一般机房而言即便是外部电缆断掉,UPS启动之后六个小时电力消耗完了,柴油发电机也应该在15分钟之内启动并且维持电源供应,并且UPS与柴油发电机之间必须实现无缝连接。从理论上来说,大规模的断电事故是不应该发生在IDC机房的。”世纪互联方面目前还没有对本次事件给出具体回应。
作为机房用户如何选择IDC呢
用户寻找IDC机房基本上从服务品牌、网络品质几个重要的方面进行考察。用户到机房看到相关参数,对网络环境进行测试。但是对于具体是几路市电接入的还是无法进行检测。在这样的情况下用户只能尽量寻找一些有品牌有背景的运营商机房,毕竟运营商需要考虑的不仅是自身的服务安全,还需要考虑全国的服务。
洪雷先生认为:“IDC就相当于一个面向企业的银行,不仅保存着企业的硬件设备更重要的是寄存着数据信息。硬件设备与数据信息就好比企业的本金,企业把本钱存在IDC里面,不但没有增长本金反而减少了,这样不能成为一个达标的IDC机房。”
作为用户来讲必须认识到没有绝对安全的机房,参数只能用作参考,实际的应急方案才是真正的需要考察的。用户在选择IDC机房的时候需要选择有实力的服务商,并且需要在不同机房建立起自己相应的灾备机制,这样即便是发生了可怕的故障也不会影响到自身的业务运作。在51CTO技术沙龙《IDC挑选运维经验谈》中田逸老师为大家介绍了很多IDC选址的经验。
【编辑推荐】