在数据中心人们常犯的十个错误

运维 系统运维
在数据中心,小失误可能会导致大问题 —— 那对于你的组织(以及对于你)会是大麻烦。本文中总结了10个常见的错误,感兴趣的朋友可以看看,或许可以帮助你避免失误。

导读:在数据中心,小失误可能会导致大问题 —— 那对于你的组织(以及对于你)会是大麻烦。

我们都经历过 —— 犯了愚蠢的错误还希望没人看到它,祈祷这个错误不会对系统或者网络产生负面影响。通常这些错误都没问题,只要错误不是发生在数据中心。数据库中心能让你的 个人失误出现在终端用户的机器上的。但是当你在服务器机房,你就需要反复检查那些失误。不关你是在配置数据中心或者是管理它,你都要时刻保持高度谨慎。

好吧,你懂他们所说的完美计划……最终还是会出差错。但是,知道但是了解的一些常见的错误可以帮助你避免失误。

1: 出丑的电缆

你知道一句古老的格言——切割之前先测量两次(谋定后动)。有多少次你访问一个数据中心看到到处都是电缆?在地板上,挂在天花板跌落下来,绕在服务器架子 上和越过桌子。这应该不会发生。电缆铺设应给予它所需要的谨慎。它不仅是一个安全隐患,也正是等待发生的灾难。有人纠缠下去-您冒着法律诉讼和数据丢失的 风险,都是因为有人懒得去测量要用的电缆或花时间去系住一些超5类网线。 take the time to zip tie some Cat5。

[[76342]]

2:喝酒惹的祸

我知道,这看起来似乎很疯狂。但我亲眼目睹了很多次。管理员(或者其他IT员工),进入数据中心后,手拿酒瓶,将其放在某设备上或是塞入其中。转眼之间, 设备就这样被毁了还不给你任何挽救的机会。每个数据中心应该有一个醒目的标志,“呆在数据中心的时间里,禁止喝酒或携带食物。”该项规定必须以零容忍的态 度或一视同仁的强制执行。甚至和酒有关的都应当禁止。

3:用电故障

这涉及到几乎任何和电有关的问题:突然断电,缺乏备用电池,没有发电机,太依靠单一电源。在数据中心,电就是你(数据中心)唯一有意义的生命。没有他 (电),你的数据中心什么也不是。同时,电也是你最害怕的对手。如果你没有按照你所需的电路来设计防止电路故障的话,你的数据中心就处于危险的边缘。确保 所有的断路器(和任何其他有可能引起电路损耗的开关)都已覆盖,还有火警,不切断开关的位置将可能会引发如恶作剧一般的后果。

4: 安全疏忽

你给出了多少能够进入你的数据中心的钥匙?你是否有每个钥匙相关联的每个名字的电子表格?如果没有,为什么?如果你不保持纪录谁能够进入数据中心,你就相 当于打开门,并且说“进来偷我的数据”,那次你支持进出口敞开着,以便你能够将刀片服务器和电缆带进来,是什么回事?多少次这个敞开的门是无人值守的?或 者当你为了使你的工作更容易,而将安全码给了实习生或者快递人员?。……看看这个正在哪里发生?

5: 类似猪舍的瑕疵

当你踏入数据中心的时候,你的第一印象的什么?你会不会将公司的CEO带进数据中心,并且说“这就是你花钱建造的宫殿?”或者在让董事长瞧见你的工作之前,你需要一天的时间去注意?

6: 文档丢失

你到底是如何标注那个网络的?它的域名证书是什么,它在放在那台服务器上?如果你要出去度假,你忽视了你数据中心的文档,那么某个命令在另外的人手上会有 点戏剧性。更有甚者,会忘记了域管理的证书。我知道,我知道-这概率很小。但是,有个叫墨菲(参考墨菲法则)的家伙,他知道,你也知道最终会怎么样。如果 你不对你的数据中心撰写文档,总有一天命运女神总会因为你的懒惰和混乱将你撇下。

7: 桌面娱乐

你发现了多少次你或者其他员工将数据中心的机器当桌面台式机使用?除非那机器是Linux或者Mac系统,否者你会发现像sexy.exe之类的病毒在你 的数据中心中蔓延。诚然,终端用户也可能会造成这种情况,但是为什么我们要在数据中心的内部网络中冒这样风险呢?当然,邀你的朋友们在数据中心举行一个 WOW和CoD的局域网Party是非常酷的。 但,我们最好还是别这样做。

8:遗忘的承诺

你最后一次亲自访问你的数据中心是什么时候?或者你仅仅只是看过然后就忘了?你认为因为你能够随处远程访问就没事了吗?真替你羞耻。你必须常规性亲自造访 数据中心。 这个造访不需要一整天的时间。仅仅是过去检查一下电池、温度、线缆等等。 如果你没有与数据中心所需的面对面的时间,你可能会亲手造成一场灾难。

9:观光录像

你对你的数据中心感到非常骄傲:真是太自豪了,以致想向外界炫耀。因此你带来了媒体;你允许游客行走穿越,并且领会它绝对的帅气。但是其中一个游客太过好 奇,导致网络宕机。你已经在这个数据中心投入了数十万美元(或者仅仅几万——或者甚至只有几千)。你无法承担公众对技术领域好奇而导致灾难的风险。

10: 午夜屠夫

别否认:你眼睛花了整整一夜在你的数据中心。无论是你的服务器重建还是网络掉线,晚上为了熬夜时不让自己睡着已经喝了无数杯咖啡。著名的一句话,如果你已 经在工作上花了九个或者十个小时,那么你最后需要做的就是花另外五个或者十个小时来试图修些什么。大多数情况你为了修复它又弄坏了比你所需要修复的更多东 西。你可以尝试换班让其他人来干,别为了当英雄而把自己锁在数据中心里“无论多久”,放聪明点。

其他错误?

你是否目击因为一些简单的错误而造成数据中心的灾难事件(或者自己就干过)?把你的经历与我们一起共享吧。

原文出处: techrepublic  

译文出处: oschina

责任编辑:黄丹 来源: oschina.net
相关推荐

2022-07-22 15:55:32

Python代码语言

2013-07-03 10:10:22

2009-07-09 09:15:22

2015-12-14 10:20:57

Python程序员错误

2015-11-24 11:51:49

数据中心挑战

2021-07-26 10:07:16

勒索软件恶意软件安全

2015-12-17 11:48:07

数据中心运营错误

2023-07-31 10:21:56

数据中心运营商

2017-09-25 07:29:35

数据中心措施方法

2017-09-25 06:08:44

数据中心宕机

2012-12-26 09:44:24

2023-02-02 08:00:00

SQLJava开发

2018-02-27 13:48:01

大数据管理者数据

2018-09-29 09:34:20

Python错误初学

2013-07-08 10:36:50

2018-07-29 06:10:01

数据中心储能UPS

2020-06-16 08:51:28

数据中心人工智能技术

2015-11-09 11:24:48

数据中心数据中心优化

2010-03-02 18:20:10

数据中心
点赞
收藏

51CTO技术栈公众号