一天,某处室的一上网用户打来电话反映上网有问题;刚开始的时候,笔者还认为这是上网用户自己原因造成的,于是随口建议他重新更换一个IP地址,或者重新插拔一下网络线缆试试;没想到,电话还没有挂断,其他上网用户纷纷打来电话,集中反应无法上网故障,这才让笔者感到事态的严重性。既然出现了大批量用户无法上网的故障,笔者赶快到故障现场进行去处理。
组网环境
到达故障现场,笔者先进行了一番仔细勘察,发现那些无法上网的用户基本都来自四楼;查看网络结构拓扑图,笔者发现四楼所有用户全部通过超五类网络双绞线连接到两组堆叠的华山3050交换机上,这些交换机都集中放置在四楼的专用配线间中。为了实现与局域网网络的高速连接,所有楼层的接入交换机统一使用SFP/1310nm/10km型号的模块,并通过千兆多模光纤连接到局域网的核心交换机上,核心交换机选用的是华山8500路由交换机,该交换机位于局域网的中心机房中;其中四楼的接入交换机与局域网核心交换机之间的直线距离大约为200米左右,它们之间采用的连接方式为:接入交换机——光纤接线架——核心交换机,光纤线缆与光纤接线架等设备统一都是由本地的宽带运营商提供的。为了有效防止广播风暴现象对整个局域网的运行产生影响,局域网中的所有电脑根据所在处室的不同,划分为了8个VLAN,每个VLAN的网关统一设置在局域网的核心交换机上;平时,各个楼层中的所有电脑都能正常上网,并且上网速度非常快捷。
故障排查
由于出现故障的上网用户,全部来自四楼网络,笔者下意识认为这种故障肯定是由四楼网络自身因素引起的;为了判断自己的分析是否正确,笔者立即使用笔记本电脑,到其他楼层网络进行测试连接,发现在其他楼层上网访问一切正常,显然局域网的核心交换机工作状态是正常的,问题看来要在四楼网络中仔细寻找。
1、查交换机
既然四楼网络中那么多用户同时不能上网,那么问题应该先从楼层接入交换机开始查起;想到做到,笔者立即赶到四楼专用配线间,仔细观察接入交换机上SFP/1310nm/10km型号模块的信号灯状态,发现该信号灯处于熄灭状态,这就意味着四楼交换机级联端口没有被正常启用,难怪连接到四楼交换机上的所有电脑不能正常上网访问了。会不会是四楼接入交换机自身有什么问题呢?通常遇到交换机存在问题时,无论大问题、小问题,我们只要简单地重新启动一下交换机后台系统,各种故障现象就能立即消失了;这次笔者也没有例外,可是让笔者感到非常失望的是,当四楼交换机重新启动稳定后,四楼网络中的所有电脑还是不能上网,这说明上述故障现象可能与交换机自身系统没有任何关系。
2、查端口
有没有可能是四楼接入交换机与局域网核心交换机之间的级联端口工作模式不匹配呢?想到这一点,笔者认为可能性还是存在的,如果它们的端口工作模式不匹配,四楼网络与局域网网络之间的通信就会不正常,那么四楼网络自然也就不能正常上网了。为了检查它们的连接端口是否匹配,笔者分别以系统管理员身份登录进入两台交换机后台系统,使用“interface”命令进入级联端口的视图模式状态,在该模式状态下执行“display interface xx”命令(其中xx为级联端口号码),查看级联端口的配置信息,发现它们的工作模式是匹配的,它们统一使用的是1000兆、全双工模式。
3、查模块
在排除交换端口因素后,笔者打算将光纤线路的收发端口进行一下对调,也就是说在交换模块上将插入的两条光纤芯号线交换一下位置,让之前插入到TX端口上的芯号线插入到RX端口上,让之前插入到RX端口上的芯号线插入到TX端口上。由于这项操作需要在核心交换机与接入交换机两端同时进行,于是笔者请另外一位同事在核心交换机现场进行帮忙;让笔者感到非常意外的是,这位同事赶到核心交换机现场时,发现对应模块上的信号灯处于点亮状态,这是为什么呢?后来,当我们同时调换收发光纤的端口位置时,发现四楼交换机对应模块上的信号灯又处于点亮状态了,与此同时核心交换机模块上的信号灯却熄灭了,会不会是连接四楼网络的这对光纤被弄错了?经过仔细检查,笔者确认这对光纤线路没有弄错,那么为什么在交换过收发位置后,四楼交换机灯会亮,而核心交换机的灯会熄灭呢?
经过与同事认真分析,笔者认为交换机的模块不存在任何问题,因为当交换机的端口处于1000兆、全双工模式状态时,两侧的光端口在通信时不需要经过协商,只要交换模块的RX端口收到了光信号,那么对应端口的信号灯状态就会被点亮;相反,如果交换机的端口处于自动协商模式状态时,光纤线缆中的两根芯号线必须同时连通,才能保证它们在通信时协商成功,两侧的交换模块信号灯状态也应该处于同时点亮状态。可是,现在一端交换模块的信号灯处于点亮状态,另外一端处于熄灭状态,这说明连接四楼交换机与核心交换机的这对光纤线缆中有一根芯号线是不通的,在对调收发端口位置后,交换模块的信号灯仍然是一侧点亮、一侧熄灭状态,显然交换模块是没有任何问题的,问题出在其中一根芯号线上。
4、查光纤
既然问题确定出在连接四楼交换机与核心交换机的这对光纤线缆上,那么究竟那根芯号线存在问题呢?由于笔者手头没有专业的工具,于是邀请本地宽带运营商技术人员,到故障现场帮忙进行检测、查看。本地宽带运营商技术人员带来了一种光功率计这样的工具,该工具专门用来判断光纤线路通与不通的;经过反复测试、检查,技术人员发现这对光纤线缆中间存在很大的信号衰减,导致其中一根芯号线根本无法正常收到光信号;后来,技术人员又使用了一种叫做光时域反射计的专业工具,对这对光纤线缆的信号收发进行了测试,终于找到了光信号大幅度衰减的原因,原来是光耦合器自身性能问题造成了信号衰减,重新使用新的光耦合器设备进行替换过后,这对光纤线缆终于通畅了,四楼网络中的所有电脑经过测试,发现无法上网的故障现象也立即消失了。
故障总结
通过认真排查,我们终于找到了故障的罪槐祸首是光纤信号衰减,造成了上网失败故障。为了帮助各位更好地解决由光纤信号衰减引起的网络不通故障,笔者上网对这类现象的形成原因进行了搜索、总结,发现造成光纤信号衰减主要有以下几个因素:
1、跳线因素。通常来说,我们在铺设光纤线缆的时候,使用的线缆在性能方面还是能得到保证的,同时工作人员在实际施工的时候,也会对光纤线缆的性能进行质量测试,如果真的质量不过关的话,也会在***时间发现问题;可是,光纤跳线这个细节因素往往不引起人重视,并且市场上的光纤跳线在质量方面也是千差万别,我们很多人在选用光纤跳线的时候,往往抱着无所谓的态度去随意选择,当我们运气不好,选择了一个质量不好的光纤跳线时,光纤信号能够衰减10个dbm,这个衰减幅度足以造成网络连接不通故障。为此,为了避免光纤跳线因素的干扰,我们必须在组建网络的时候,到质量硬、信誉好的公司去选择跳线;当然,如果条件允许的话,我们***在够买现场,使用光功率计来测试一下自己购买的跳线。
2、耦合器因素。由于光耦合器一般都是安装在光纤配线盒上的,对于它的质量问题,相信很多人都会忽视它的;可是,在实际管理网络的过程中,笔者发现光耦合器要是性能不好的话,也容易造成幅度比较大的信号衰减,所以如果在组网的过程中需要单独购买光耦合器的时候,还是需要到质量硬、信誉好的公司去购买。
3、耦合次数因素。为了把位于不同局点的光纤线缆连接起来,我们通常需要在管道进内对光纤线路进行耦合;通常情况下,我们对光纤线路每进行一次耦合,光纤信号就会衰减1个dbm左右,要是耦合的次数比较多的话,那么光纤信号的衰减幅度就会大大增加,这样一来也会影响网络连接速度。
4、光纤接头因素。这是一个比较常见的问题,要是大家仔细留意一下,就可以发现任意一对光纤线路,哪怕是通信良好的光纤线路,我们只要使用究竟将光纤接头反复擦拭几遍,光纤信号的衰减都能减少2个dbm左右;因此,当光纤线路工作时间比较长了之后,或者光纤线路处于灰尘比较多的工作环境中时,我们应该尝试使用究竟来擦拭光纤线缆的接头,相信这样能够获得意向不到的效果。
5、交换模块因素。很多时候,管道进或地下使用的是多模光纤线路,可是用户在选用交换模块时,却选用了单模交换模块,如此一来它们之间的连接就会出现不匹配现象,那么就可能引发数据严重丢包、信号衰减幅度增大等问题;同样地,如果交换模块是多模,但光纤跳线却是单模的,这也会引起网络连接不正常故障;此外,光纤线路与光纤跳线之间如果不匹配的话,同样也会造成不正常的网络故障。
基于上述理论分析,我们在排查光纤线路连接故障时,可以尝试按照下面的步骤来进行:
首先使用专业的光功率计或光时域反射计,来检查光纤线路的连通性是否正常,如果能够正常收发光信号的,那就意味着光纤线缆的连通性是正常的;要是发现光纤线路不能正常收光的话,那就存在两种可能:一是光纤线缆的两侧没有正确匹配,二是光纤线路存在断裂现象,这个时候我们必须请专业铺设光纤线路的人员来检查、解决问题了。
在确认光纤线路连通性正常的情况下,要是交换机的光模块端口无法被正常启用的话,那需要重点检查交换模块的工作模式以及信号衰减问题,具体的排查步骤可以参照上面的顺序来进行。