在维护路由表信息的时候,如果在拓扑发生改变后,网络收敛缓慢产生了不协调或者矛盾的路由选择条目,就会发生路由环路的问题,这种条件下,路由器对无法到达的网络路由不予理睬,导致用户的数据包不停在网络上循环发送,最终造成网络资源的严重浪费。一般引起路由故障的原因有很多,例如管理不善,私自接一些交换机、路由器等。如何解决路由环路故障?本文用实例演示如何破解由于交换机引起的故障。
笔者单位采用了标准的三层网络拓扑结构,即核心层、汇聚层、接入层。接入交换机采用二层交换,汇聚交换机采用了三层交换,划分了多个VLAN,每个部门一个VLAN。客户端连接24口接入交换机,接入接入交换机上联汇聚交换机,汇集交换机为每个部门分配一个VLAN,每个VLAN一个C段。如:部门A的VLAN号为10,IP地址段为:192.168.10.0,子网掩码:255.255.255.0,网关:192.168.10.254。
一、故障现象
某日接到部门B的电话,说整个部门都不能上网,于是先在自己电脑上进行测试,PING我部门网关显示正常(我部门网关和部门B的网关不同)显示正常,访问Internet也正常,也并没有其他部门反映网络故障,所以排除全网故障。并不是部门B的某一台电脑不能上网,所以怀疑属于部门B的内部局域网故障。
二、故障排查过程
1. 远程登录汇聚交换机,进行网络排查。
登录汇聚交换机,在汇聚交换机中Ping部门B的网关,Ping不通。
查看交换机接口状态,该部门的接口状态显示为:“err-disabled”.经过分析后,认为最可能的原因是环路引起的,但是还不能确定,因此需要现场测试。
2. 现场测试汇集交换机。
在汇聚交换机上拔下该部门的上联线,利用笔记本直接联入汇集交换机,将笔记本的IP地址设置成该部门的IP。并通过Console口登录交换机,查看状态,发现此接口还是处于“err-disabled”状态,利用命令“shutdown”,再“no shutdown”,重启接口,接口状态变为“connected”。经过测试,在笔记本上可以Ping通网关,而且访问Internet也正常,因此断定是该部门局域网有问题。
3. 测试该部门局域网。
该部门使用的是二层交换机连接到汇聚交换机,二层交换机连接了各处室的办公计算机。找到该部门连接汇集交换机的上联线,连接笔记本,经过测试,也能正常访问,说明上联线到汇聚交换机的线路正常。于是将上联线插回二层交换机,将笔记本联入测试,结果Ping不同网关,不能访问Internet。此时观察交换机的指示灯状态,也未见明显异常。
4. 逐步排查,找出问题。
只能孤注一掷,逐一排除了。拔掉所有网线,请同事协助远程登录汇聚交换机重启该部门的接口。先将笔记本接入,利用“Ping 192.168.20.254 –t”命令测试网络连通性,显示可以Ping通,证明不是交换机故障。将网线一根一根联入交换机,并同时观察Ping的状态。因为每根网线都有标签,标明了房间号,当插入某房间的网线时,笔记本上Ping状态为超时,因此可以断定此房间的线路存在问题。将此网线标记,继续排查。按照同样的步骤,重启端口、联入网线。直到插入所有网线,也没有出现超时的错误,可以断定是这根网线引起的故障。
5. 顺藤摸瓜,找出故障产生的原因。
前往网线上标注的房间查明故障原因。发现该房间的墙插上连接了4口交换机,小交换机的四个口都插满网线,办公室只有三台电脑,电脑走明线连接小交换机,经过排查,发现一根网线的两端都连在交换机上,形成了路由环路,将其移除,经过测试故障解决,该部门能够正常访问Internet.
三、经验总结
1. 加强管理。引起路由环路是因为管理不善,对各部门的控制力不足,需制定相应的管理制度,完善联网准入制度,不准私自购买小交换机、无线路由器等设备。
2. 规范、细化网线标识。对网线进行明确标识,网线的两头都打上标签,标明办公室、接口号等。如:303A,说明是303办公室的A口,依此类推。
3. IP/MAC地址实名制。进行IP/MAC地址实名制管理,登记每台电脑的IP地址、MAC地址、使用人、计算机型号、序列号等信息,最好做到IP地址和MAC地址进行绑定,这样可以提高网络安全,防止非法接入,有利于事后审计。