【51CTO.com 综合报道】IT运维中,我们将面对哪些威胁?
专家研究和大量企业实践表明,IT项目生命周期中,大约80%的时间与IT项目运营维护有关,而该阶段的投资仅占整个IT投资的20%,形成了典型的“轻服务、重技术”现象。国际著名咨询调查机构Gartner集团的调查发现,在经常出现的问题中,源自技术或产品(包括硬件、软件、网络、电力失常及天灾等)方面的问题其实只占20%,而流程失误问题占40%,人员疏失问题占40%。流程失误包括未做好变更管理、超载、无测试等程序上的错误或不完整,人员疏失包括忘做某些事情、训练不足、备份错误或安全疏忽等。
面对如此高的要求和压力,IT部门就需要有一套完善的并可管理的IT服务流程,对IT运维进行有效地管理、使信息系统更加适应业务持续变化的需求、使IT部门从成本中心转变为利润中心。当现代企业建立完善而成熟的IT运维管理体制后,通过流程管理,不断提高IT运维质量,实现高效运维,提升组织内IT服务满意度。
我们的IT运维该如何保障?
图1 |
事件管理
具备强大的事件管理功能。事件管理能够根据被监控资源的监测状态发生的因果关系,进行逻辑上关联分析、生成事件。在生成事件的过程中,再根据相关规则定义对故障进行排查,准确定位发生故障的原因。事件生成后,系统根据用户定义的事件级别对事件的重要性、危害性进行判断,分级别告警,对于重要的,危害性大的事件进行优先告警,以便确保影响关键系统的故障得到及时解决和处理,尽可能减小故障可能造成的损失。
故障管理
故障管理,通过系统预定义好的故障情况,准确定位故障的级别,并通过多样的告警方法将故障信息派发给直接负责人员,避免故障的无法及时处理和是否升级的判定。
故障管理通过设定故障规则,能够为一个设备设定多个报警规则或多个设备统一为一个事件报警规则,为每个事件规则设定相关的级别,由系统来确定故障级别和通知对象,并自动触发相关的工单给相关人员。故障信息可以通过声音、告警灯、短信、邮件、脚本等形式告知故障处理负责人。
配置管理
配置管理提供系统配置功能,包括报警配置、事件配置、视图配置、用户权限、监测配置等供配置控制模块调用。IT部门可以通过此模块简单的进行配置控制,对配置信息进行变更,对系统设置进行管理。
问题库管理
提供问题库的管理,管理人员可以把在运维过程中遇到的无法解决的问题录入到知识库中,让系统对相关的问题进行分配,让对应职位的人员进行处理。同时提出人还可以对问题进行跟踪,这样就不会让提出的问题石沉大海。
知识库管理
◆用来记录系统故障情况及维修记录的;
◆用来帮助管理员排查系统故障的工具;
◆用来给管理员提供问题的处理办法的;
◆用来给管理员提供运维经验。
预案库管理
提供预案库管理,管理人员可以让对相关事件有过处理经验的人员就相关的情况编写一份处理预案,当不熟悉这个事件处理流程的人员进行处理时有据可以。同时极大的缩短了人员培训的时间,也帮企业节约了成本。
摩卡IT运维管理(Mocha ITOM)
摩卡IT运维管理帮助企业建立快速响应并适应企业业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。