交换机性能下降引发蝴蝶效应

运维 网络运维
与普通集线器设备相比,市场中销售的交换机设备很少有伪劣产品,这也在某种程度上确保了普通交换机设备性能往往比较稳定;不过,这并不意味着交换机设备不会发生故障。

本文下面的一则网络故障,就是由于交换机性能下降,无法抵挡局域网广播风暴的袭击,而出现了缓存溢出错误,最终导致局域网出现无法上网故障!考虑到该故障发生机率不高,解决起来很容易走弯路,为此笔者就将该故障的详细排查经过还原出来,与各位朋友共同交流!

部分计算机不能连网

某单位局域网规模不是很大,共有40台左右的普通计算机分别连接到品牌、型号完全相同的两个二层交换机上,两个二层交换机又通过级联方式与单位的核心交换机相连,同时两台文件服务器也直接被连接到核心交换机上,并通过核心交换机与Internet网络直接保持连接。

平时,局域网中的每一台普通计算机都能访问单位的文件服务器,也能通过局域网网络直接到Internet中上网冲浪,并且连接到两个不同二层交换机中的计算机相互之间也能进行共享访问。在相当长的一段时间内,局域网中的所有交换机都能正常工作;可是近日,局域网中有几位用户想通过网络共享交流文件,结果他们无论怎么鼓捣,也不能从网上邻居窗口中找到对方的共享资源,没办法他们只好向笔者求援;起初,笔者还以为这仅仅是一种个别现象,可是没有多长时间,又有一些朋友来电说网络不能访问了,直到此时笔者才意识到局域网网络中可能真的出现了大问题。

笔者随机来到一台不能上网的普通计算机现场,对其各个上网细节进行了全面检查,结果看到该计算机上网参数设置正确、网络接口连接牢靠、系统自身也运行正常;之后,笔者又检查了几台计算机,发现有的计算机竟然能够上网访问Internet网络中的内容,并且网络访问速度还很快。仔细对比了能上网与不能上网计算机的各个细节因素后,笔者竟然找不出任何可疑的地方,这究竟是什么原因呢?

故障现象初步排查

既然局域网中同时有多台普通计算机不能上网访问,那会不会是局域网中的核心网络设备出现了问题呢?想到这一点,笔者立即来到局域网的主机房,查看了接线柜中的各个交换机设备,偶然发现其中一个二层交换机工作状态明显不正常(如图2所示),因为该交换机控制面板中的所有信号灯全部处于点亮但不闪烁状态,信号灯一直不闪烁,那就意味着网络中没有数据信号在交换传输。经过进一步检查测试,笔者发现凡是连接到故障交换机中的所有计算机都不能上网,而连接到另外一个二层交换机上的所有计算机都能正常上网。

会不会是那台长亮不闪烁的交换机遇到了硬件故障呢?为了验证那台故障交换机是否真的存在硬件损坏,笔者先是拔下连接该交换机的电源线缆,过几分钟后又重新插入电源线缆,之后笔者看到故障交换机在重新启动后,对应控制面板中的信号灯居然全部恢复正常的闪烁状态了;此时,笔者再从故障计算机中尝试访问Internet网络时,发现网络连接也已经正常了,并且网络连接速度也是一气呵成。笔者做梦都没想到,简单地重新启动了一下故障交换机设备,看上去非常复杂的网络故障竟然瞬间被解决了;然而好景不长,故障交换机设备重新启动一个小时之后,其控制面板中的所有信号灯又变成长亮不闪烁状态了,原先能够访问网络的计算机也不能正常上网访问了,而这个时候单位的核心交换机以及另外一台二层交换机工作状态一切正常,这是什么原因呢?

深入追究故障原因

由于故障交换机在重新启动后能够正常工作一段时间,这说明该交换机没有发生硬件损坏,看来问题还是出在“软”设置上,会不会是网络病毒在暗中“作祟”呢?笔者联想到前一段时间,局域网中曾经出现过由于网络病毒发作引起的上网速度缓慢现象,后来要求每一位自己动手查杀病毒的,但笔者相信局域网中肯定还有病毒存在,会不会是这些残余的网络病毒造成了交换机工作状态不正常呢?但转念一想,要是真的是网络病毒在暗中“作祟”的话,那局域网中的两台二层交换机都应该出现故障才对呀,毕竟它们的品牌、型号完全相同,甚至连接方式也是完全相同的,而现在只有其中的一台二层交换机发生故障,于是笔者认定故障交换机还是存在硬件故障,要想解决部分计算机不能上网的故障现象,唯一的办法就是更换交换机设备。

但由于单位没有备用交换机可以使用,笔者只好先关闭那台二层交换机的电源,准备过一段时间向上反映情况之后购买新交换机回来再说。趁这些普通计算机不能访问网络的间隙,笔者决定自己动手对连接到故障交换机中的所有计算机进行全面杀毒,以便将威胁局域网稳定工作的各个因素全面排除。耗费了几天时间杀毒之后,笔者看到局域网中果然隐藏了不少流行病毒,到网上随意搜索一个病毒的详细资料时,发现这种类型的网络病毒容易引发广播风暴现象;有没有可能是网络病毒引发的广播风暴现象,造成了那台二层交换机不能正常工作呢?由于目前局域网中的所有病毒都被清除干净了,按理来说这个时候局域网中就不应该继续存在广播风暴现象了,那么那台二层交换机的工作状态会不会也能跟着恢复正常呢?为了检验自己的猜测是否正确,笔者将那台二层交换机的电源重新接通,起初的一段时间那台交换机的工作状态很正常,不过笔者仍然担心过一个小时后该交换机又会出现相同的故障;不过事实证明自己的担心是多余的,连续过了几个小时,那台二层交换机控制面板中的所有指示灯状态依然处于闪烁状态,直到此时笔者才隐约感觉到该交换机不会出现问题了。果然,经过连续几天的运行,先前不能上网的部分计算机再也没有掉过线,这说明上述网络故障已经被成功解决。

揭开交换机瘫痪之谜

尽管部分计算机不能上网的故障已经被解决了,不过其中的一台二层交换机为什么会瘫痪,还是让笔者一直疑惑不解,因为局域网中既然存在广播风暴现象,那么品牌、型号、连接方式完全相同的另外一台二层交换机为什么没有受到任何影响呢?带着这样的疑问,笔者到网上求教了一些网络高手,经过与网络高手们进行反复交流分析,终于找到了交换机瘫痪的真正原因:网络病毒是部分计算机不能上网的表面原因,因为网络病毒造成了局域网发生了广播风暴现象,这种现象致使其中的一台二层交换机工作状态不正常,所以连接到该故障交换机中的所有计算机都不能上网访问了;事实上,那台瘫痪的二层交换机自身性能下降才是网络不通的真正原因,虽然局域网中的两台二层交换机型号、品牌、连接方式都相同,但它们持续工作的时间可能不相同,那么交换机内部的性能元件老化程度也不相同,其中性能老化严重的那台二层交换机无法抵挡广播风暴现象的袭击,最终引发了缓存溢出错误;当笔者将局域网中的所有病毒全部清除干净后,那么广播风暴现象也就不会袭击故障交换机了,这也是在重新启动一下故障交换机系统后,对应系统的工作状态能够恢复正常的原因。

最后的故障总结

从上面的故障排除过程来看,我们认为交换机性能的好坏对局域网整体性能的稳定有多么重要!为了让局域网网络能够更加稳定地运行,我们在组建局域网的时候,不能一味看中产品价格,去选用一些质量不好、内存容量不大的低价交换机,而应该去选用那些质量可靠、品牌过硬、内存容量较大的交换机设备,毕竟这样的高档设备自身有较强的抗干扰能力。

为了防止局域网中频繁出现广播风暴现象,我们应该在局域网中安装配置专业防火墙程序,并且在每一台计算机中安装杀毒软件,同时及时在线更新病毒库程序进行病毒清除操作。当然,除了网络病毒会造成广播风暴现象外,由网络连接出错而引起的连接环路以及网络设备的硬件损坏因素,也会引起广播风暴现象,因此在查杀完网络病毒后,局域网中要是仍然存在广播风暴现象时,我们就应该仔细检查局域网中是否存在网络环路现象,或者检查网络设备是否存在硬件损坏现象。

【编辑推荐】

  1. 慧眼识别交换机性能质量优劣
  2. 判断交换机性能好坏的九个因素
责任编辑:张恬恬 来源: 互联网
相关推荐

2013-08-02 14:27:28

2010-01-07 11:21:25

2010-11-23 11:03:16

跳槽

2013-06-27 09:47:07

处理器英特尔ARM处理器

2011-05-16 11:30:03

DBA故障关键

2018-03-06 11:25:04

漫游流量运营商

2013-12-17 09:52:55

4G移动互联网

2017-12-12 08:32:14

代码蝴蝶效应系统

2009-05-22 09:23:11

2010-01-28 14:08:06

2016-10-13 15:51:50

2009-05-22 08:58:15

2012-11-02 09:43:30

微软公共云Office 365

2010-01-18 13:35:52

2009-07-22 14:30:11

2010-09-07 10:45:05

富士康

2011-08-11 10:45:31

2013-03-11 14:50:16

阿里云王坚云计算

2013-10-25 10:02:52

2013-10-25 10:36:19

阿里云2013阿里云开发者大云计算
点赞
收藏

51CTO技术栈公众号