北塔软件IT运维管理:故障处理的良方

企业动态
IT运维管理人员几乎每天都在与“故障”打交道,而当业务系统足够复杂的时候,仅凭“感觉”往往无法再判别出故障的根源。那么,如何才能让IT运维管理跳出“手工作坊”阶段,在故障发生时准确定位、快速修复,乃至利用更先进的IT运维管理工具避免非计划性的停机事故呢?

 IT运维管理人员几乎每天都在与“故障”打交道,而当业务系统足够复杂的时候,仅凭“感觉”往往无法再判别出故障的根源。那么,如何才能让IT运维管理跳出“手工作坊”阶段,在故障发生时准确定位、快速修复,乃至利用更先进的IT运维管理工具避免非计划性的停机事故呢?

“与时钟赛跑”的故障处理

我们身处在一个高度依赖网络的社会,一旦网络出现故障,企业员工可能会无法正常工作、无法交易导致公司订单丢失、企业可能会失去大量的客户等等严重问题。然而,IT系统本身的复杂性、层级性和关联性,又决定了“故障”必然存在的现实。不过,当故障发生时,IT运维管理人员身背着的***压力并不是技术层面的,这来自于修复故障的“时长”。如果一笔业务不能完成的时间长达一天或者数周,就可能引发“多米诺骨牌”式的传递效应,最终让企业运营遭受重创。

一般来说,与故障分析难度成正比的,是系统的复杂性。业务系统越复杂,涉及的设备、软件、厂家、人员就越多,可能带来的故障分析难度也就越大,恢复的时间也就越长。虽然,有些网络故障解决办法是相通的,人的作用非常大,但从随时变化的网络架构和业务系统实际运行的复杂环境来看,解决相同现象的故障,方法可能迥然不同。如果我们在IT运维管理的过程中,过多的依靠个人经验,或者PING、TRACER等命令,都会让排错的时间变得不可控,并造成IT运维服务质量停滞不前的尴尬局面。

作为国内领先的IT运维管理专家,北塔软件认为:“依靠个人能力进行运维管理有许多缺点,比如无法做到事前发现、无法做到准确定位、故障原因可能出现误判、响应时间慢等等。因此,要想与时间赛跑,就需要一个高效而准确的故障发现机制,一个能够支撑故障分析策略的工具,这是企业建立故障处理体系的***步。”

以“路径”为核心的故障分析方法

基于ICMP的管理,只能对服务器和网络设备的连通性进行简单性测试,在网络建设阶段的作用很大,但在业务逐渐复杂的管理阶段就显得力不从心了。为此,北塔软件在其发布的北塔BTIM产品中包含了化解故障处理复杂性的“故障根源分析策略”、TFS管理系统、业务流量视图。再复杂的系统,都有数据行走的路线,所以北塔BTIM的三大功能设计都以“路径”为核心,通过日常高频度监测少量关键指标,控制被管系统管理压力,一旦发现问题,依据业务流量实际流量路径,按分析需要逐层扩大数据采集的深度和广度,层层深入,直达故障根源。

首先,通过TFS管理系统,实现了对网络设备、主机、数据库、中间件以及应用管理的实时监控。管理人员在业务层就能查看所有关键信息,而一旦出现告警事件,管理人员就可以通过TFS故障诊断路径直接定位源头。

其次,在故障处理的操作层面,北塔BTIM提供了业务流量分布图,它以物理拓扑为基础,业务流量为骨干,透明化的展现了业务数据在网络中的真实路径,并实时展示各路径上的业务流量及用户接入设备。利用业务流量的路径图实现主动监测,更可以在庞大而复杂的网络中,发现隐患。管理员可以对业务各关键路径7X24小时监控,通过对于各关键路径的响应时间分析,并结合支撑组件的情况进行智能梳理,可帮助运维人员直击可能引发非计划性宕机的隐患点。

针对故障管理,北塔软件还提醒广大企业用户:传统的故障处理模式只能导致出现问题后的被动响应,而IT运维管理部门的真正价值并不是出现故障之后的处理,而是在故障发生前能够准确判断,排除隐患,并避免故障的发生。所以,针对IT运维人员和管理者都需要的统计和分析方式,北塔BTIM系统提供了实时TOPN分析、指标历史数据分析,以及详细的分析报表,帮助用户定位到IT系统瓶颈,及时调整策略,提前避免故障的产生。

责任编辑:老门
相关推荐

2009-06-04 14:53:48

2012-02-16 17:41:16

IT运维管理北塔软件

2011-06-15 15:07:09

北塔软件BTNM武汉海关

2011-11-17 15:00:31

北塔软件运维管理

2013-06-18 17:56:59

北塔软件IT运维

2012-01-06 20:05:29

北塔软件IT运维

2012-07-11 16:35:47

北塔IT运维

2011-11-17 14:37:03

北塔软件IT运维管理

2010-03-05 10:14:49

北塔软件江西永平铜矿

2009-06-19 11:56:13

信息安全运维管理北塔

2010-05-12 15:13:35

智能运维管理世博会北塔软件

2009-07-03 20:06:57

BTIM

2009-09-18 14:05:50

北塔BTNM事前运维管

2011-06-10 16:19:35

北塔BTNMIT

2011-01-27 11:07:23

北塔网络运维

2010-03-05 10:22:58

2009-10-26 09:37:25

2009-04-08 09:18:40

汽车运维管理北塔

2009-11-19 10:57:39

IT运维管理

2010-11-11 11:39:08

IT运维管理北塔BTIM IT综合管理
点赞
收藏

51CTO技术栈公众号