作为核心决策层的重要成员,CEO的铁杆拥护者,某企业的人力资源总监(CHO)对IT运维部门提出的“加人”需求极为不满。CHO感觉:“几套围绕ERP边缘的子业务系统还没上线,运维部经理就和CIO联手 '一而再,再而三'的要求招聘运维工程师,用于新增子业务系统的监控和维护,他们不考虑人力成本”。
而运维部门的工程师也心怀不满:“人手本来就紧张,上了这么多业务应用,日志看都看不完,还指着我们上ITIL。公司再不招人,我们只有走的份了。除了工作,我们还有生活呀!”
重重矛盾应该如何化解呢?作为国内领先的IT运维产品和服务提供商,在IT运维最前沿积累了长期宝贵经验的北塔软件认为:“IT基础设施的管理看起来简单,但实际上却有着很强的专业性,随着企业规模和IT系统的扩展,子系统不断增加,如果仍然依靠传统的监控软件,就不可能实现集中管理和分级维护的目标。因此,如要释放运维人员的压力,提升IT系统在企业中的核心价值,我们只有站在业务的本质上去改变运维,而最直接和有效的方法,就是用业务的视角来管理IT。”那么,如何践行才能实现这一方法呢?下面,我们以北塔BTIM(Betasoft Integrated Management,IT综合管理软件)为例,全面剖析“业务视图”是如何帮助我们改变消沉已久的运维现状。
基于“通断”的运维已经“过时”
从网络设备自带的命令行管理工具,到针对网络协议的监控软件;从编写监控服务器CPU的脚本,再到现在基于拓扑自动发现的IT运维系统;从业务的辅助手段,到引领公司前行的整合工具。随着我国信息化渗透指数的不断提高,IT运维方式和应用手段都发生着一系列的变化,我们从网络系统的管理到业务服务系统的管理,一路走来。
历史的车轮从未停止,IT运维的产品也是如此,只不过有些IT维护系统的速度有点跟不上业务发展的脚步。某公司的销售部门报告说ERP系统上不去了,但IT部门没有接到预警信息,又一次非常尴尬的局面。IT工程师迅速检查日志,一步一步地查找故障:ping一下路由器、检查一下Web服务器的CPU使用率、数据库服务器的内存使用率……但通过这些表象的监控对象,工程师花去了2个小时,还是无法找到问题的根源。
经过调查后,我们发现,由于这家企业网络的监控对象独立分割,同时又停留在基于ICMP协议的监控管理,所以只能对服务器和网络设备的连通性进行简单性测试。大量的一线数据证明了,这些“常识性的操作”在网络建设阶段的作用很大,但在应用阶段就显得力不从心了。随着基于IT平台的业务系统在企业中的地位逐步成为核心,对这些系统的健康性管理,与简陋的运维工具之间的矛盾就越发的显现出来。#p#
业务系统运维的本质在于整合
前面提到了基于“通断”的监控方式,为何不能体现出业务系统运行的详细状况呢?首先,让我们以北塔众多客户中的一家大型烟草企业为例,来看看这家企业的业务平台是由哪些对象组成的:
通讯平台:由数据交换和安全保障两大平台组成,其中又包括了交换机、路由器、防火墙、入侵检测系统,以及内部数据中心的高速线路和跨越不同的地域、不同主机平台上的广域网链路组成。
主机平台:硬件主机平台包括存储系统、服务主机系统、群集系统、UNIX小机、Linux和Windows三大平台,并且这些服务器分别采购,部署在集团的数据中心和分支机构的小型设备间。
软件平台:软件平台包括支撑烟草业务系统运行的Web服务环节、交易服务环节、数据库环节、中间件环节、服务器操作系统、终端操作系统和浏览器等等。
通过这家企业业务组成对象的简单罗列,我们不难发现,如果我们利用“通断”方式来进行维护,就不可能将所有对象综合起来进行统一管控,不可能将业务的本质体现在IT运维中,这就是业务的:“不可分割性”。为了说明整体性,我们还可以假设把网络设备的监控软件单独拿出来的例子,如果单独看设备管理的话,那么它只是具有观赏价值,而不是应用价值。所以,针对业务系统的运维,要把业务系统涉及的每一个对象都合并起来,当成是一个整体,这是因为它们从来不会因为硬件,或是存在位置而形成独立的个体。
业务视图使你不在“受控于人”
北塔软件副总经理孙永杰先生认为:“随着业务系统一个又一个地建设,其各自所配套的、彼此各不相关的监视系统也一个又一个地被建造出来,并各自孤立地投入运行。由于子业务系统建设目标的局限性,使得其所配套建设的监视系统的关注对象只可能是子系统本身,这也是我们需要建立业务视图的原因。从这个意义上说,业务视图所关注的重点应当是各个分散的子业务系统的整合结果,以及全面的工作状态、运行效果以及与之直接或间接相关的各个方面,如:业务系统自身的能力、周边环境等等。”
无论是“能力强度缺陷”类(如:数据库系统的错报能力不足)问题,还是“能力范围局限”类(如:超出服务器的负载能力范围)问题,都是系统单靠自身能力无法解决的。系统在运行中一旦遇见问题,只有凭借外力予以解决,这也就是前面提到运维部门和人力资源部门产生矛盾的原因,因为大多数的运维经理都会相信:“单位内部有多少个业务系统,就需要配备有大体上数量相等的、几乎一一对应的运维团队”。但这种运维格局不会改变吗?事实上很多企业利用循序渐进的方式,在最终形成了基于业务视图运维的形态下,已经不再“受控于人”。#p#
业务视图是如何形成和发展的?
以前面提到的烟草企业为例,北塔软件利用BTIM帮助客户从三个阶段实现了IT运维的改变。这是由于BTIM从设计之初,就是一款基于BSM方法论的IT综合管理平台,因此这家企业可以利用它重新定义IT运维的目标和效果,真正的将IT与业务融合,实现了透明化、智能化、精细化的IT全方位管理。在具体的实施过程中,我们可以看到北塔是通过如下的步骤协助企业解决运维需求的:
第1步,首先是进行IT基础设施综合管理平台的建设。BTIM的实施,完整覆盖了网络、安全、机房、服务器、数据库、中间件、应用等各个方面的管理。同时,提供了性能、故障、报表,各类数据流分析、资产管理、IP地址空间管理、跨地域的分级分权的广域网信息管理。并通过事件自动识别和智能归并技术,可以让IT人员迅速实现每一个基础设施的故障根源定位。
第2步,构建业务视图,实现业务服务管理(BSM)建设。此时,企业已经可以从IT基础设施综合管理平台,以一致的方式来展示每个子系统的事件信息,并能够与配置管理平台(CMDB)紧密融合。所以,我们现在可以围绕企业的关键业务,借助动态的业务响应视图来引入服务水平协议(SLA)机制。在此阶段,将各个分散在子系统中的元素贯穿和统一起来,利用BTIM中的业务视图,非常清晰的看到业务架构、业务运行、业务使用、事件原因分析、业务统计与分析。
第3步,是实现虚拟化数据中心和私有云的整合监控,形成新一代的运维架构平台。由于在前一步中业务监控的建设已经到位,此时业务部门和IT部门拥有了统一的管理语言和管理视角,从而使得私有云的建立只需要调整业务视图的拓扑,便可立即让业务服务模型能够清晰地描述业务与虚拟主机之间的关键指标。
通过上述描述,我们清楚的看到,业务视图的建立,实际上是让多个子业务系统符合一个完整业务流程的过程。消除了这些子业务系统运维的语言障碍,通过一致的标准和统一的界面,那么,这样的运维改变对于业务流程和整体效率而言,都可以达到预期的效果。