网络瘫痪了!到底哪里出问题了?十几年网工网络故障排查经验总结

运维 网络运维
对于故障管理,十几年网工生涯帮我积累了非常重要的网络故障排除经验。结合理论和实际工作经验可以分为三种方法:分层诊断、分段诊断和“望闻问切”仿中医诊断。
杨工,我电脑不能上网了。

杨工,我无法连接总部VPN服务器了。

杨工,整个公司网络都瘫痪了。

工作中我经常接到这样的电话,也一般情况都能在段时间内解决,十几年网工生涯帮我积累了非常重要的网络故障排除经验。

故障管理是网络管理中最基本的功能之一,它包括发现并诊断故障、孤立故障和恢复故障三方面(孤立故障其实就是暂时性恢复故障,应急性地让其它部门恢复网络使用)。其中,诊断故障是网路故障管理的先决条件,网络故障每次出现的现象也是形形色色的,没有任何一种检测方法或者工具可以诊断出所有的网络问题。十几年的网工积累的经验就能少走弯路,轻松应对大部分的网络故障。

结合理论和实际工作经验可以分为三种方法:分层诊断、分段诊断和“望闻问切”仿中医诊断。这三种方法综合使用基本能排除所有的网络故障问题,构成了一个立体网络故障诊断模型。

网络故障

一、分层诊断网络故障

就TCP/IP协议而言网络包括物理层、链路层、网络层、传输层、应用层五层。分层诊断从物理层开始,逐层向上检查,直到应用层。

  • 物理层故障主要在线缆方面是否存在不连通、衰减等问题;
  • 链路层故障主要在数据帧丢帧错发问题,还有流量控制等问题;
  • 网络层故障主要在路由协议是否加载或者路由设置错误,还有IP地址、子网掩码和网关等设置错误等问题;
  • 传输层故障主要在防火墙、路由器访问列表配置有误,过滤限制了某些服务链接等问题;
  • 应用层故障主要在操作系统的问题,如CPU、内存、I/O、核心进程等运行情况是否正常;应用服务是否开启;服务器配置是否合理;安全管理、用户管理是否存在问题等问题;

二、分段诊断网络故障

分段诊断就是对网络源端到目的端所经过网络路径及网络设备进行分段处理,将网络故障定位到某一段的设备或相应的连接线缆及附件上。这种诊断又细分为迭代诊断和子网分段。

  • 迭代分段是从源端开始,检查源端到网络中某一节点是否工作正常,如没问题,再检查源端到更远一个节点是否工作正常,以此类推,直到找到故障节点所在。
  • 子网分段是用在不同的子网互联时诊断网络故障的方法。例如,有一种故障是两个子网连接在一起就有问题,断开其中一个子网就又正常了。是不是想到了VLAN,对!有时候trunk模式设置出问题就会出现这个情况。

三、“望闻问切”仿中医诊断网络故障

中医治疗疾病时候,讲究“望闻问切”。在网络出现故障的时候,这种方法同样非常适用。

[[240988]]

1. 望

望就是看、观察的意思。网络故障排除中,我们也要先通过查看PC机和路由器的初始化信息,网络设备的指示灯信息和操作系统或应用软件运行速度,以达到网络故障诊断和网络维护的目的。

  • 初始化信息是了解硬件信息和软件版本,排查是否因为硬件特性或者软件版本等问题导致不兼容情况出现,版本新旧的不对称也会导致网络故障。
  • 设备指示灯是了解硬件是否处于正常工作阶段。如网卡、交换机、光猫、路由器等面板上的LED指示灯。通常情况下,绿灯表示连接正常,红灯表示连接故障,不亮表示无连接或线路不通。还有根据数据流量的大小,指示灯会时快时慢的闪烁。这些都是我们判断网络是否故障的重要依据。

 

[[240989]]

  • 操作系统或者应用软件运行速度快慢。有时候不一定是网络问题,由于电脑中毒导致个体网络变慢或者无法上网的情况比比皆是,甚至像ARP等网络病毒影响的确实整个局域网,相当可怕。

2. 闻

闻不单单是闻气味,也包含听声音。计算机和网络设备正常工作时,风扇和磁盘读取数据发出来的声音都是有规律的,如果出现异常声响,就要采取紧急措施,如关闭电源等。正常工作的机房或者机箱是不会有异味的,如果有闻到塑料的焦糊味,往往是电源或者芯片出问题了。现在的网络设备质量上基本没啥问题,但也不排除出现这种故障的可能性。KB小网管所管理其中一机房的一台H3C S3600交换机就出现风扇故障。

[[240990]]

3. 问

问就是网络故障时,应该向故障单位网管或者当事人询问以下问题:

  • 故障什么时候出现?
  • 故障表现是什么,如连续故障,还是间断故障。
  • 故障发生的时候,操作者正在对计算机进行什么操作?
  • 网络结构有没有发生了什么变化?比如新增路由器、交换机,以及网络配置更改。
  • 网络用户组发生变化了吗?如由于工作关系一组用户变为另一组用户。域控环境。
  • 是否新增或删除广域网路由?安装了新协议了吗?是否安装了新服务器?

带着这些疑问来了解问题,往往能够对症下药更快更直接地找到问题,排除网络故障。

4. 切

切在中医上就是把把脉,用手敲两下,基本上就能确定下来什么病。同理网络故障诊断的时候,借助网络故障诊断工具找到故障所在地方。如测线仪、第三方抓包软件以及Windows自带网络命令工具等等。

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2017-03-24 09:50:00

2019-02-14 10:13:42

网络故障RIPIGRP

2010-09-25 13:52:11

无线网络故障排查

2011-01-24 13:42:27

网络故障网络故障修复

2022-08-18 10:56:36

零信任网络安全

2010-09-16 14:30:26

无线网络故障

2023-11-10 07:23:57

Kubernetes集群网络

2022-08-03 08:10:43

零信任网络安全防御体系

2018-12-04 09:07:36

运维问题排查

2016-08-15 15:35:35

群晖NAS群晖发布会

2018-11-08 12:43:21

硅谷企业Facebook

2009-05-19 16:40:41

TTL网络故障科来软件

2018-08-08 15:35:42

网络故障网络异常网络报错

2012-11-14 13:55:10

2010-08-31 09:17:17

2015-08-24 11:02:56

网络故障负载均衡

2010-08-05 09:46:54

2019-04-11 09:17:14

网络故障路由汇总

2021-03-02 06:02:03

Kafka高并发系统

2011-03-14 14:13:28

网络故障
点赞
收藏

51CTO技术栈公众号