随着网络规模的扩大,企业中拥有越来越多的业务系统和成千上万的终端, IT运维管理部门的压力也越来越大。那么,这些压力源自哪些方面,哪些人会对运维方法的变革上非常敏感,而管理员又当如何化解这些压力,将大型网络的运维也能像SOHO一样进行配合和管理呢?
压力源自“失控”
大型网络中的系统一般是由几个阶段建设而成,在网络建设的起始阶段,老一代的管理员只需要深入了解服务器操作系统的白皮书就可以应对自如。但随着网络向多元化技术方面发展,当远程分支机构和网络合并重组之后,各样的业务系统都需要细致入微的关注,再加上引进开放式系统,很多复杂的问题就产生了。涉及到网络,主机,数据库,甚至客户端的故障,管理员都很难定位其根本原因。而且随着运维人员专业化分工以及分支机构的IT管理中心的成立,很多问题的沟通成本加大,没有高效管理流程,一大堆问题就出现了。于是乎,我们再也不能像以往那样运筹帷幄,网络失控了!
由于运维人员已经不清楚网络里面什么已经是最重要的,所以下属机构的网络纷纷要自己想办法解决问题。在北塔软件近几年的实施项目中发现,很多大型网络的总部还没有建立一整套或运维方案时,下面的分支机构却都配备了一些网络监管工具,但当总部想要实施ITIL或是部署ITSM的时,这些分散的数据由于无法提供统一的接口,根本没有实现集中监管的条件。
抓住共性和特性是大型网络实施ITSM的思路
从新的技术来说,虚拟化,自动化,包括开源,包括数据安全,网络安全,很多方面的元素都是大型网络运维当中必不可少的,但万变不离其宗,大型网络自身的特点还是集中在了“稳定性”的性能指标。稳定性即是确保大型网络能够在发生故障时自动切换到备份网络,从而确保业务正常运行。这也就是我们在IT运维中一直所强调的改善,改善就意味着一要清楚你的现状,二要清楚你的目标(稳定性),这两点是要基于大量监控数据分析的。
既然我们搞清楚了大型网络对于稳定的目标,那么实现业务和服务管理的稳定依据是什么?很显然,这需要充足的管理要素,在如今业务和IT结合日益紧密的背景下,复杂IT系统中发生的每一个事件,都可能对业务带来巨大影响,因此对这些“管理要素”的有效收集十分必要。北塔BTIM凭借对事件进行根源定位分析,实现了对IT系统基础设施的全面可视化管理,使业务服务的管理不再是纸上谈兵,无米之炊。
大型网络运维中的问题是消除分支机构的运维数据孤岛。北塔BTIM的管理控制台,除提供整个监控管理中心的基本框架外,主要作为整个监控管理中心的集成平台,集中展示关于系统监控数据、流程平台、数据报表等信息,未来应用系统的扩展都依赖于这个基本框架。,一旦企业网络规模加速扩大,根据这个柔韧性好的构架,集成后台各种运维管理平台,为中心和各分公司提供一个统一的运维管理信息访问入口,实现运维工作中的协同工作。
那么针对业务系统的特性而言我们应该如何提供运维服务呢?大型网络中的业务系统通常有多种不同的子业务系统构成,北塔BTIM可对各子业务系统进行汇总,每个子业务系统所组成的异构硬件平台、数据库平台、中间件和软件平台都可以再细分为各种应用系统,每个应用系统都可以为其自定义状态分析指标。通过进一步的设定,北塔BTIM可把所有子业务指标汇总呈现在总的业务视图中,这便实现了大型网络中集中管理和分级维护的目标,释放了运维人员之前的压力。
IT运维管理要求不断改善内部IT架构的运营效能,以及与业务之间的关联性,从而支持业务的灵活性,利用北塔BTIM方可使IT服务管理人员越来越受到企业决策者们的重视。