高效运维工程师的“三个瞬间”

安全
效率乃企业生存与发展的生命线,很多企业是在企业信息化平台上处理业务的。高速、稳定与可靠是运维系统工程师的职业操守,也可通过提高员工工作效率而极大地推动企业竞争力。

效率乃企业生存与发展的生命线,很多企业是在企业信息化平台上处理业务的。高速、稳定与可靠是运维系统工程师的职业操守,也可通过提高员工工作效率而极大地推动企业竞争力。在仍然有许多IT运维技术人员过着苦行僧生活的时候,小郑(某企业运维部工程师)却因为网络建设与生产经营活动的推动马上将要得到提升。当然,还有很多衡量员工是否应该升迁的方法,我们这里主要想夸奖一番小郑的效率和与其年龄不符的老道。

◆警报短信来了,我还在车上

地点:班车

时间:早上8:10

当小郑在班车上睡得正香的时候,突然公司网络中心的北塔BTIM告警系统自动发来了短信:“ERP数据库的日志归档空间达到了95%的利用率”。这个时候一般的系统管理员会非常紧张,通知值班的管理员,赶紧尝试归档到其他的服务器,而小郑倒头有在靠背上睡去了。难道等到了单位在处理吗?其实,小郑已经今天的工作就是整理归档服务器的磁盘空间,准备将备份日志转存到二级存储设备,那么他为什么不担心服务器空间已经到达阀值了呢?

一般采用运维管理工具的管理员都知道,对于主机和网络系统的监控大都在特性上体现了网络连通性、设备负载、TCP告警、端口状态以及流量、线路状态以及流量、设备日志信息、设备配置变动、SNMP连通性以及Trap信息等。另外,短信报警也不是什么新鲜事物,小郑之所以可以又倒头睡去,使因为他在采用BTIM系统在告警的同时,还可以执行多种关联动作,这样就防止了他如果没有在机房现场时候将有可能影响日常业务的威胁自动被排除在外面。两个月前,小郑已经通过BTIM的知识库设计了将归档日志自动FTP到目标服务器的脚本,并且刚才短信中的后面一行也提示了这个转存日志归档“已被激活”。

◆马上就好,5分钟就到

地点:打印间

下午:3:30分

到达单位之后,在将辅助DBA(数据库管理员)调整了服务器之后,几乎什么事也没有发生,中午刚过,CIO突然下发通知,下午3:40到5楼会议室集中,IT事业部所有员工和综合事业部经理都到参加分公司网络改造的预备会,同时要求IT事业部提供分公司的网络拓扑图,并复印14份。小郑和邻桌的同事要过来,拿着图纸就要到2楼的打印间去复印,电梯上小郑发现了蹊跷,这份图纸还是4个月以前的,后来分公司自行进行过一个网络调整,并且替换了部分设备,这份图肯定不能用呀!要是光逻辑拓扑图还好说,现在还要用上物理拓扑图,重画?来不及了!小郑还是不慌不忙地返回了工位。要是碰上这种情况,对于适用一般的网络设备发现功能的管理系统肯定是不行了,还好BTIM系统同时提供物理拓扑和逻辑拓扑双重结构。

这里我们插一句话,物理和逻辑拓扑在网络管理中的作用是不同的。前者强调物理,即真实网络的动态反映;后者强调逻辑,即宏观网络静态反映。BTIM之所以在发现结果上采用了物理拓扑图,并不是因为逻辑拓扑不重要。而是因为从绝大多数的像小郑这样的管理员角度出发,物理拓扑所能提供的价值要远大于逻辑拓扑。物理拓扑图是作为运维系统的最基本也是最直接的一种发现问题机制,具有举足轻重的地位。

三点半,“大哥!印完了吗?快上来吧,要开会了!”因为CIO这个人十分守时,所以胆小的同事老张给小郑打了加急电话。“放心!5分钟准到!”小郑到很干脆的答道。会议开始,每个人拿到打印好的拓扑图,你画一条线,我加一个设备开始了激烈的只有IT技术人才有的“吹牛”阶段。不过,网络架构是否合理,有无网络瓶颈,设备和流量有无异常等,还是等下面小郑的与出惊人的分析吧。

◆以下是数据,我来谈谈具体的升级思路

地点:会议室

时间:17:05

中国人喜欢开会,但开会不一定有什么结果。过了下午5点左右,所有人担心的事情就是赶不上6点的班车该如何回家的问题。其实这次网络改造是IT部门提出来的,这也是CIO需要今天解决的事情,看来没有结果会议是散不了的了。很多IT技术人员往往注重升级过程中设备的选择,忽视了业务系统在升级前的监控。而在升级项目结束时,他们害怕网络系统和应用系统升级没有得到业务部门的认可,投资回报不明显,遭致高层的质疑。

也可能会议准备的不充分,几个关键人物对业务系统的现状讲的模棱两可。小郑附耳向身边的IT事业部门主任提醒:“咱们还是打开运维系统有针对性的说吧?”于是乎,主任如卸重负,通过笔记本在大屏幕上对兼顾生产和研发两重身份的分公司,分析了已经监测的关键业务流程,这包括:①项目管理信息系统和生产管理信息系统。② 网络吞吐量大的业务流程,如实时交互式的业务流程,资金集中管理系统、协同流转系统和备份中心等。③ 对系统造成巨大压力且频繁使用数据库平台。

***,CIO也根据手中已经掌握的一些情况对同其它与总部系统集成的业务流程进行的详细说明,并要求IT事业部不要忽略这些非主要业务系统的存在,提示大家在做方案的时候,考虑到它们,因为这很有可能造成网络升级故障的风险。会议准时在6点前结束,走出会议室的时候,CIO过来拍拍了小郑的后背,我们估计刚才小郑的附耳的声音大了一些,被他听见了。

以上的故事告诉我们,一个优秀的IT运维管理平台与一位精明的IT工程师结合起来了功效。小郑的一天还告诉我们,不论IT业务系统庞大而牵涉面有多广,只要能够精确掌控,你永远可以把它放在手中。

责任编辑:许凤丽 来源: 互联网
相关推荐

2015-01-22 15:14:02

IT运维高效

2019-10-29 16:29:28

运维架构开发

2019-05-15 11:14:22

监控工具运维

2015-07-15 15:36:16

运维工程师优衣库运维

2016-10-13 09:30:46

Linux运维工程师运维前景

2012-07-24 13:36:58

运维

2013-12-18 10:56:48

Linux运维运维技能

2012-05-08 15:31:09

运维南非蚂蚁

2009-09-16 11:44:26

IT运维

2017-06-12 10:00:07

Linux运维工程师基本技能

2022-06-20 22:37:25

Linux操作系统命令

2018-07-13 16:06:45

Linux运维基本技能

2015-07-22 12:50:18

Linux运维

2016-09-14 15:41:38

2016-12-08 14:19:12

数据中心运维工程师

2019-05-20 11:45:32

运维日志容器

2017-02-03 20:50:08

Linux

2012-07-05 14:46:21

运维工程师

2016-11-04 13:30:07

Python运维工程师

2013-07-03 17:55:37

IT运维信息化
点赞
收藏

51CTO技术栈公众号