几乎是一瞬间的工夫,单位局域网中的所有工作站几乎是同步脱网,数据传输流量立即下降为零,使用Ping命令测试重要网络设备的IP地址时,无一例外地发现都存在非常严重的数据丢包现象。在追查该故障现象的原因之前,还是先向各位朋友简单介绍一下单位局域网的组网情况吧。
单位大楼内共有六个弱电间,分布在每一楼层中,每个弱电间中的普通二层交换机通过宽带光纤线路连接到位于主机房中的核心交换机上,当瞬间脱网故障发生时,笔者恰好在其中一个弱电间中进行例行设备检查。接到故障求援电话后,笔者立即检查了所在弱电间中的普通二层交换机工作状态,结果发现该设备控制面板中的数据信号灯疯狂地闪烁,瞬间流量竟然达到了八个加号,而其极限数值只有十个加号;当笔者尝试将宽带光纤接口从其拔下时,对应信号灯立即停止了跳动,其速度自然也跟着下降了下来。后来,笔者连着检查了其他几个弱电间,发现这些普通二层交换机的工作状态几乎都是一样的。
追查故障原因
从二层交换机上找不到蛛丝马迹,笔者立即赶到主机房,准备对核心交换机的工作状态进行认真检查。笔者先以telnet命令远程登陆到核心交换机的后台管理界面,检查其峰值速度,发现该参数一切正常,也没有发现广播数据或大包数据攻击本地内网,为此笔者推断本地内网存在病毒攻击的可能性不是很大。
会不会是本地内网中,有人将其他一些计算机或网络设备的IP地址修改成与核心交换机的IP地址一样,导致局域网出现了IP地址冲突现象呢?为了排除这种可能因素,笔者在核心交换机的后台修改了它的IP地址,再重新启动了一下核心交换机系统,结果发现上述故障现象一切依旧。
考虑到局域网中经常会出现ARP欺骗现象,为了检验该现象是否是瞬间脱网现象的“罪槐祸首”,笔者开通了安装在几台服务器系统中的ARP防火墙,并让其持续运行一个小时左右,结果没有发现ARP欺骗现象;后来,笔者借助专业工具,对交换机几个重要光口进行了依次扫描,以便对各个工作子网中的MAC地址进行检查,结果证实本地局域网也不存在非法地址入侵现象。
由于核心交换机支持双主控单元,笔者打算更换其中一块主控单元看看,于是切断核心交换机的连接电源,更换掉另外一块主控单元,再将该交换机系统重新启动一下,在开始启动的时候,笔者发现网络通信好象恢复正常了,可是时间不长相同的故障现象又出现了,这说明瞬间脱网故障与交换机的主控单元无关。
到了这里,笔者对核心交换机该做的检查都已经做了,可以肯定的是,核心交换机自身不存在任何问题,本地局域网中也不存在发包病毒,ARP欺骗现象也被证实不存在,这么一来能出问题的地方看来只有通信线路了。
解决故障现象
为了弄清楚究竟是哪条通信线路出了问题,笔者先将连接到核心交换机设备上的所有光纤接口全部拔掉,仅保留了主机房中的几台服务器系统与核心交换机直接相连,此时笔者使用Ping命令进行大包测试,发现Ping命令测试操作一切正常,几台服务器系统也能正常访问网络了,这说明核心交换机的工作状态的确是正常的。
接着,笔者依次将每一个光纤接口正确连接到核心交换机上,并且每次连接一个光纤接口,都进行一次大包ping命令测试,当测试到连接到四楼弱电间的光线接口时,笔者发现故障现象再次出现了,看来整个局域网网络出现瞬间脱网现象,是由于这个地方的问题引起的。查阅光纤接口资料,笔者很快找到了这条线路是连接到四楼,专门用于对外培上网训使用的,顺藤摸瓜,笔者没有费多大工夫就找到了连接该光纤线缆的二层交换机;先是观察该交换机的信号灯状态,发现果然存在问题,于是借助专业的线缆测试工具,对网络线路的连通性进行了测试,结果发现这段线路竟然存在短路现象,看来该现象就是造成瞬间脱网故障的“罪槐祸首”。
经过更进一步调查,笔者发现连接交换机的某条普通双绞线接口出现了水晶头金属片插脚变形现象,该现象直接导致了物理连接线路短路,看来水晶头变坏肯定是其他网络管理员平时插拔不当引起的,重新更换新的水晶头,故障现象果然立刻消失了。
最后的总结
到了这里,瞬间脱网的故障现象终于被解决了,不过总结上面的故障排除过程,笔者发现自己犯了经验主义错误;遇到局域网中出现不通的故障现象,总会下意识认为本地网络中存在网络病毒或其他不安全攻击,或者认为网络中的一些重要设置被修改了,而忽略了对一些物理因素的检查,而事实上,一些物理因素平时很难引起我们各级网络管理员的注意。
【编辑推荐】