近年来随着我国加入WTO,国内银行特别是长期处于政府保护之中的国有商业银行,面临的竞争压力是越来越大。除了外资银行不断引入的挑战外,国有商业银行改革的挑战也是不能忽视。如何提升国有商业银行的战斗力呢?大多数人都认为还是要提升银行的服务水平入手,只有保障良好的金融网络运行环境,才能提高银行自身的生存能力。作为IT运维管理专家,北塔软件针对金融行业提供了专业的运维管理解决方案,为维护良好的金融网络运行环境做出了优异的成绩和应有的贡献。
下面我们举例一个北塔软件在某银行的金融网络中发现问题和排查问题的过程:
告警描述:某银行网络出现故障,多台交换设备不能获取SNMP信息,发生告警;伴随着一些业务有连接振荡现象(连接时通时不通)。
管理人员立即启用北塔BTNM进行了层层深入的剖析,并最终发现了问题的根源所在:
某银行的网络架构图
第一回合:
问题分析:出现问题的设备型号不一致、网络所在位置不相同,没有固定规律,管理员怀疑是网管机中病毒的原因,导致处理数度缓慢不能接收某些交换机SNMP信息。
测试手段:管理员更换新安装网管软件的网管机。
结果:问题依旧,有问题的交换机还有取不到数据,正常的交换机取数仍然正常。
第二回合:
问题分析:网管机没有病毒,管理员考虑是否监控设备数量过多,导致处理数度缓慢不能接收某些交换机SNMP信息。
测试手段:于是减少了网管机的监控设备数量(只监控核心路由B、存在故障和无故障的营业点交换机各一台)。
测试结果:问题依旧,
第三回合:
问题分析:在排除网管机中毒的可能性后,问题还是回到网络层面上来。管理员陷入了沉思,在过往的工作经验中有因防火墙不能处理过多SNMP包,而导致丢包现象,或许是这个原因?
测试手段:管理员更改了线路连接方法,让网管机直接连接到有问题的“核心路由B”上。
测试结果:“核心路由B”能够获取SNMP数据,但是营业点的交换机还是存在故障的不能取到数据,正常交换机没有异常,一样能取到数据。
第四回合:
问题分析:防火墙导致丢包可能性被排除后,问题落在“核心路由B”上了,设备“核心路由B”以前一直能够夺取到SNMP数据,最近没有作过IOS升级,不可能是设备的自身问题;
如果设备“核心路由B”真的有问题,是否表示只要经过该设备,进行数据交换的营业点交换机就出现问题呢?
测试手段:管理员通过静态路由方式,让存在故障的营业点交换机的路由,通过“核心路由A”来交换,同时再让正常工作的营业点交换机的路由,通过“核心路由B”来交换。
测试结果:好的营业点交换机通过有问题的“核心路由B” 来交换数据,变坏了;有问题的营业点交换机通过好的“核心路由A”来交换,故障消失。
第五回合:
问题分析:问题已经锁定在设备“核心路由B”上,那样到底是设备“核心路由B”的处理能力问题?还是访问列表等配置问题呢?
测试手段:查看CPU处理值,查看访问列表
测试结果:CPU只有19%的占用率,不是性能问题。网管员只能查看数百条的访问列表配置了,最终还是找到了有冲突的访问列表,修正后所有的设备SNMP取数回复正常。
问题总结:由于网络管理员过多使用访问列表,或使用访问列表不当,导致出现上述问题,通常这种“软故障”是最难处理的,但是在通过北塔软件有效的监控手段下,是能够及时的发现这种“软故障”。并且还通过北塔BTNM网络拓扑图,管理人员能够快速定位哪些设备同时出现了该问题,并快速判断这些设备是否在同一个网络结构层面上,是否同型号的设备等数据分析结论。
所以说,北塔BTNM不但能够自动地发现网络上地问题,还能够为管理人员提供数据分析,并最终圆满解决问题,成为管理人员保障好金融网络系统的得力助手。北塔BTNM从网络管理的角度提升了科技竞争实力,有力推动了国内商业银行的信息化建设。