案例背景
广东地税在当前的信息系统基础设施监控中,存在管理分散、各自为政、隐患不能及时发现、监控资源不能有效整合等问题。同时,在对业务系统的健康性监控方面,尚缺少自动有效的办法,往往在已经影响用户正常使用,在接到用户反映时才发现问题,未能在出现隐患时及时发现,影响了用户的使用体验和正常工作。
方案介绍
广东省地税运维监控项目中,主要实现了以下主要功能:
1.集中监控
将主机、数据库、中间件、网络设备、机房环境、存储/备份等多种IT资源通过统一的RIIL监控平台进行监控展现。建设了一个统一处理各种设备告警事件、集成呈现各IT基础设施运行状况的整体运维监控平台。
2.告警管理
通过告警规则的灵活配置,实现了在统一的告警事件平台上,将不同级别,不同类型的告警事件准确的分发给不同科室,不同角色的系统运维人员。支持业务视图关联告警、网络拓扑图关联告警、设备信息页面关联告警;能够按时间、设备分类、级别等条件直接查询告警;支持CS模式桌面告警、短信邮件告警通知等多种告警方式,方便运维人员快速、灵活、便捷了解业务系统的状态,及时发现问题,解决问题。
3.性能管理
提供了实时性能数据、历史性能数据的查询方式,通过曲线图、表格数据、原始数据、统计数据等多种展现方式,方便用户及时查看系统当前性能数据及系统历史性能数据。及时了解系统的现状与历史负载,避免设备性能瓶颈影响业务系统正常运行。
4.网络拓扑监控
通过自动发现和手动编辑两种方式,快速准确地搭建覆盖广东省地税系统从省局到地市、区县的三层网络拓扑结构。支持设备列表与网络拓扑图的关联定位,直接通过独立的设备页面跳转定位到网络拓扑图中;丰富的链路流量性能指标、多种颜色区分告警级别及链路状态的展示帮助运维人员快速方便的了解网络拓扑信息。
5.用户及角色权限管理
与用户的统一工作平台对接,方便统一的用户管理;灵活的权限设置,满足用户不同角色运维人员的日常办公要求。通过对监控设备、系统功能、拓扑视图细粒度的角色权限划分,让不同的运维人员只看到各自权限内的监控内容,以便系统管理规范。
功能亮点
通过RIIL平台的统一呈现,帮助客户集中统一管理全省地税系统的各类监控对象,同时又能从业务角度了解地税业务系统的健康状态和运行情况。
通过FDB、CDP、ICMP等多协议支持的拓扑发现,能快速准确的发现网络中的各种网络设备。
通过全网拓扑图和分层拓扑图可以从全网角度和地市分层角度了解网络拓扑结构,直观监控拓扑图上的链路通断及链路流量数据。
除了产品自身可以监控的网络设备、主机、数据库、中间件等各种系统指标外,同时结合地税多年的运维监控经验,将地税多年积累的业务系统个性化指标集成到本平台集中监控呈现,大大丰富了监控内容。告警信息更加准备,贴合实际应用;同时也方便地税人员集中查看各种监控信息,提高工作效率。
通过对地税各个系统的业务梳理及建模,展现了各业务系统的健康指数及响应时间,构建IT资源与业务系统模型,站在业务的高度,一切以业务系统运行为核心,帮助广东地税管理人员更好保证业务系统正常运行。
客户收益
通过RIIL的实施与使用,统一集中管理各类监控对象,逐步取代目前的脚本式的分散监控。有效的整合资源,提高工作效率。
通过灵活多方式的告警管理,帮助广东省地税运维管理人员及时准备的发现问题,解决问题,提前预知系统潜在风险,保证业务连续性,提高用户满意度,提升广东省地税的服务质量。
广东省地方税务局运维监控平台项目的建设,服务于应用,保证地税业务系统的正常运行,提升地税服务质量;服务于个人,提高地税每一个运维人员的工作效率,减少不必要的重复工作;服务于领导,帮助领导统筹规划,为今后广东省地税信息化发展提供打下坚实基础。