【51CTO精选译文】编者按:系统管理员是一个需要细致的工种,其细致程度往往到了一种谨慎强迫症的地步。但是,凡事都有过犹不及。下面这篇文章总结了一些系统管理员们因为强迫症而做过的蠢事儿,证明了一味追求各方面井井有条的做法为什么会适得其反,给广大系统管理员们做个借鉴。本文作者Paul Venezia是Infoworld资深编辑,有着丰富的运维与咨询经验。以下为正文:
有时候,你就是抗拒不了想把事情安排得井井有条的念头,尽管这么做其实没有必要;有时候,你决定处理某个微不足道或者几乎就不存在问题,到头来却平添了一大堆的工作;有时候,你希望在其他方面也能像操作计算机时摁Undo按钮那样可以撤销操作;有时候,系统明明没坏掉,你却决定无论如何要修复系统。
遗憾的是,我也犯过很多这样的毛病。
蠢事儿一:重新摆弄电源线导致弄坏了交换机
有一次,一条电源线不正确地穿过数据架的背面,使得后面的机箱门无法正常关闭。电源线拉到了一台仅与后端管理链路相连接的交换机上。我为了重新布线,将那台交换机的电源也拔下来了一会儿,因为觉得应该没什么关系。事情就是这样发生的。
当交换机重新接上后,忽然导致电源系统出现故障,这台交换机当场就报废了。幸运的是,这是只“廉价的”24口10/100交换机,只要跑一趟Staples买来一只新的换掉就行。但是,当时是晚上10点后进行深夜维护的时段,所以只好等到第二天才能去买。
可是,在接下来的维护工作中,我们还需要那几条管理链路。我***从会议室借来了一只交换机,确保完成当晚剩余的工作。
可以从两个角度来看待这件事。***个角度是,我本来就不该画蛇添足拔那根线,否则一切都正常。第二个角度是,我加快了那个电源故障的发生,让问题在我们都在场的时候暴露出来,而不是在未来某个也许很不走运的时间点。从第二个角度看来这倒是件好事,不过要是让我从头来过,我肯定不会去动那条电源线。
蠢事儿二:更新强迫症导致系统无法运行
在生产系统上,你偶尔会一时心血来潮,想更新固件以及/或者软件。这种情况下,你对交换机、路由器或服务器进行的是全然不同的操作;你注意到某个软件或交换机固件有了一两个更新版本。随后,你决定采用这个新版本。十之八九,更新软件或固件不会造成任何问题,一切按计划进行(不过实际上,这个固件更新根本不在原本的计划内)。但是也不排除更新后系统反而运行不了的小概率事情。
蠢事儿三:强迫改善某几项配置参数导致搞砸了整个配置
在某个重要项目、应用软件或其他系统的部署阶段,所有必要的部分均已落实到位,概念证明工作也在顺利地开展,部署到生产环境的工作一切看起来很正常。在你决定仔细检查系统、确保一切都尽善尽美之前,系统确实堪称***。
在有点强迫症似地力求改进的这个期间,你看到有几个参数似乎没有设置好——比如像辅助NTP(网络时间协议)服务器字段出现拼写错误,或者某个配置参数缺少描述条目,等等这些无关紧要的问题。这些本身其实都不是什么严重问题,只不过还不是很正确,你觉得应该弄弄好。
于是,你屁颠屁颠地改正了NTP地址,或者在文本字段添加了一个简短的描述,随后保存了配置。这时候,你突然认识到自己没有备份之前的配置;而不知什么原因,另一名管理员一直在捣鼓另外一些设置。你保存好了配置,实际上破坏了整个系统之前没什么问题的配置。但是你就是觉得那个辅助NTP服务器字段非改正过来不可。
结论
所有这些强迫症其实基本上是直冒傻气的行为——IT行当的这个现象就相当于,有人看到墙上贴着一张纸,看着不顺眼就一把扯下来,结果在墙纸上留下了一个硕大的洞;或者是看到一根线丝露在羊毛衫外头,忍不住把它扯下来,结果搞得一团糟,真是弄巧成拙。
其实许多时候,大的方面很容易搞定。事先又没有考虑充分地改动小细节,只会把事情搞砸了。这对于有不同程度强迫症的系统管理员而言,一定要引以为鉴。即使真的无法忍受某些不***的地方,在进行任何修改之前,一定要按照标准的流程做好备份,确保系统的可回滚性。
你有哪些因强迫症而做过的蠢事?不妨与我们分享一下。
【51CTO.com译文,转载请注明原文作译者和出处。】
原文:Admin tip: Leave well enough alone, dummy
【有关新概念运维】
在日常的系统管理运维工作中,每个人对于系统、工具、应用、命令、架构等方面都会有自己的理解。理解方式的不同也意味着不同的认知,因此,这种理解方式的交流,也可能碰撞出更多思维的火花,让每个人从另一个角度了解自己每天从事的工作。51CTO系统频道从日常和运维人员的交流中收集这些理解方式,组合成短文集,名为《新概念运维》。
《新概念运维》栏目接受投稿,有意者请联系 yangsai@51cto.com 。
【编辑推荐】