随着网络信息系统和生产管理的耦合性越来越高,重庆电力对网络运行与维护提出了更高水平的要求。但现有的网管软件却在监控实时性、管理便捷性、监控对象广泛性,以及拓扑、预警等诸多方面未能符合要求,无法确保***的优化策略及时落地。
在对原有网管系统和新增优化等需求深入分析的基础上,重庆电力采用了北塔软件的北塔BTIM IT综合管理软件,构建了故障管理***时间预警、运维管理分层处理、运行状况大屏幕实时展现平台,全面提升IT运维管理水平。
网络优化管理遇到“实时”挑战 扭转格局正在“关键时刻”
与其他能源行业相比,电力企业对信息系统的实时性要求则是***的,并且对IT的重视度、成熟度也均排在其他行业的前列。重庆电力是我国发电行业大型骨干企业,目前信息网络的覆盖范围为:一个总部、十七个直属单位、二十三个控股公司构成的三级网络管理架构。为了应对日益激烈的市场竞争,服务于内外用户,重庆电力对网络运行与维护提出了更高要求,而这份重任落在了重庆市电力公司信通分公司的运行中心肩上。
为此,重庆电力启动了《信息网络管理系统调优》(以下简称“《调优》”)专项建设,信通分公司针对专项制定了“四措一案”的工作目标,指导网络服务流程和应急响应工作。但在原有网管工具的使用中,工程师却逐渐发现,由于网管产品本身的原因,无线真实显示设备面板、无法做到机房无人值守,同时在一些数据库等特殊的监控对象上,无法实时呈现《调优》专项中的性能变化监控,如:5%变化时,立即分析原因;20%变化时,立即恢复监控前的状态。
信通分公司运行中心的IT运维工程师表示:“通过对专项和新增运维优化需求的分析,我们发现,有些网管工具只能在手工状态下调整网络拓扑,这在新增监控对象时,非常容易出错。同时,由于只能在命令行下对设备参数管理和展现,并且告警方式单一,一旦出现问题,在繁琐的配置模式下更容易出错。尤其是在专项工作中要求的性能变化处理,以及出现故障后的应急响应时,在这种‘关键时刻’再出现操作上的问题,后果将会更加严重。”
另外,在重庆电力这种超大型网络中要执行优化,就要对计算机资源分布和性能分布增加有效的监控手段,对系统故障和效率下降增加预警方式和分析工具。当然,随着网络服务体验要求的不断攀升,IT运维部门还需针对不同业务部门提供个性化服务。所以,IT 运行维护人员必须要有新的运行维护管理思想和工具以满足企业内部、外部客户对高质量服务的期待。
设备状况实时展现 巡检服务排除隐患
由于一些网管软件只能局限于对设备的配置管理,缺乏有效的展示手段,致使无法对网络资源配置及流量分布进行实时管理。同时,为了更好的满足对于上下级单位垂直管理的需求,保持在技术应用方面已经取得的领先优势。经过多方调研和专家小组对原有网管工具的横向对比,重庆电力最终选择了以北塔BTIM为核心的整体网络IT运维管理解决方案。最终,通过该工具和工程师的支持,实现了监控模式和展示模式之间快速切换,实现了监控透明化、告警及时化、展示互动化。
首先,根据重庆市电力的要求,方案运用北塔BTIM完成了IT运维监管平台的网络拓扑设备的集中监控,实现网络透明化管理,真实的网络拓扑图,集中展现了网络实时状况。另外,针对IT运维可视化的项目需求所定制开发的JMS接口数据推送功能,为可视化项目组推送了网络链路关键数据,实现了大屏展现链路指标和设备运行状况一览效果。
其次,为保证网络管理人员能及时宏观把握网络全局,实现网络高效性、科学性的管理机制,北塔BTIM支持了报表自动生成的功能,体现了IT运维管理的精髓。该系统可自动生成各个指标的报表统计,并定时、定期做出全面详细的汇报材料。该项功能将管理人员从紧张、繁琐、疲惫的工作状态中解脱出来,现在,通过量化的科学数据,网管人员可以准确的分析整个网络运行状态,在节省大量统计分析时间的情况下,保持着***的工作状态。
值得一提的是,由于电力企业的特殊性,网络管理软件一样被视为生产系统,在非计划检修日是不允许系统出现无法使用情况的。为此,北塔软件根据要求,定期对北塔BTIM系统的运行状况进行巡检,及时的将问题反馈给用户,从而***程度的保障了该系统的稳定运行。
从“来电响应”到IT运维管理的“四个质变”
之前,重庆市电力信通的IT网管人员仍然是“来电响应”的处理方式,强大的工作负荷造成了工作人员的巨大压力。针对这一迫切需求,北塔BTIM通过故障管理定位和丰富的告警类型,并结合SAL故障等级规范,进行了故障规则的定制,成功实现了“网络事前管理”的目标。如今,通过产品内置的事件处理机制,配合管理员预置的事件联动措施,可实现对告警的自动诊断与快速恢复,大幅度提高了重庆市电力信通应对突发网络事故的处理能力。
信通分公司运行中心的管理人员不断总结项目经验,并针对北塔BTIM使用前后的效果进行了评价:北塔BTIM能够实时了解各个设备运行状态,实现了从“被动”为“主动”的转变;通过提前发现设备故障隐患,实现了从“事后”处理到“事前”预防的转变;通过透明化、多角度、真实化视图实现了网络管理从“复杂”到“简单”的转变,通过全网交换机、路由器和安全设备在一个平台上的一体化管理,实现了从“分散”到“集中”的转变。