网络故障不再烦恼:一文读懂以太网接口物理DOWN故障及解决方案!

网络
为了更加精确的分析接口物理DOWN的故障原因,本文主要按照故障可能的引入点为线索,具体按照人->机->料->法->环五步骤为排查顺序,逐步找到问题根因并排除故障.

一、接口物理Down概念

以太网接口是提供给用户操作或配置的真实存在、有器件支持的物理接口,主要用于接收和发送数据。接口保持正常UP状态是设备正常运转的最基本条件。

当接口处于DOWN状态时,其指示灯状态为常灭,接口不能正常收収报文,设备上产生类似如下格式的日志:

IFPDT/4/IF_STATE(l)[3]:Interface GigabitEthernet0/0/12 has turned into DOWN state.  

您可以通过执行display interface命令查看接口当前物理状态(回显中current state字段信息)。

在上图的示例中,接口GE0/0/12的当前物理状态为Administratively DOWN ,即设备接口下存在命令 shutdown,可以断定配置错误引发接口DOWN,您需要在对应接口规图下执行undo shutdown命令。

二、接口物理DOWN原因及处理方法

引起接口物理DOWN的原因主要包括硬件和软件两类故障:

  • 硬件故障:本端或对端设备硬件故障包括单板、接口、光模块、光纤、网线等故障
  • 软件故障:主要包括链路两端配置不一致,主要包括端口协商模式、速率、双工等配置。

如下图所示,为了更加精确的分析接口物理DOWN的故障原因,本文主要按照故障可能的引入点为线索,具体按照人->机->料->法->环五步骤为排查顺序,逐步找到问题根因并排除故障.

接口物理DOWN

1.人--人为因素导致接口物理DOWN

(1) 故障原因描述

当接门由正常UP状态变为物理DOWN时,需要首先排查近期是查有人为操作当,包括错误拔插网线,误碰设备导致连线松动以及在设备上进行了命令行误操作等行为。

(2) 故障诊断操作步骤

在对接的两个设备上的任意视图下,均执行命令displayinterface interface-type interface-number,查看接口当前运行状态和接口统计信息。如图3所示,重点查看如下回显中红色字段

  • 若current state字段为“Administratively down”,表示接口被人为Shutdown,请在接口下执行undo shutdown命令。
  • 若current state字段为“DOWN”,则需要查看速率、双工、自协商模式是否链路两端保持一致。
  • 若Negotiation字段为“ENABLE”,则接口处在自协商模式,速率双工均是双方协商的结果,如果链路两端速率双工协商不一致,可以执行命令restart,重启接口,使之重新协商。如果仍然协商不成功,可执行命令undonegotiation auto,使之工作在非自协商模式。速率双工配置可参见下一情况。
  • 若Negotiation字段为DISABLE,则接口处在非自协商模式,速率双率可在接口视图下执行speed[10|100|1000]以及duplex{fulll half},使链路两端参数保持一致。
  • 若current state字段为ERROR DOWN(down-cause),表示接口由于错误事件而被Shutdown您需要根据down-cause具体字段信息排查故障常见down-cause字段值如下图所示

(3) ”故障恢复方法

批量接口物理DOWN:

  • 如果多个接口物理DOWN,并且这些接口都属于同一块单板,并连接到多个无异常的对端设备,则可能是单板异常,尝试执行命令reset slot slot-id,复位单板。如果故障仍未解决,需要更换单板
  • 如果多个接口物理DOWN,并且这些接口都是属于本端设备和对端同一设备连接的接口,则可能原因 是对端设备异常,您需要登录对端设备查看设备单板是否故障,并及时进行复位或更换操作,如果对 端设备处于主备倒换、休眠、重启等状态,则可以认为属于正常现象,待对端设备状态稳定后,一股 本端设备状接口状态即可自动恢复到UP状杰。该场号下,接口会出现频UP/DOWN,产生如下所示的大量UP/DOWN日志。

单个接口物理DOWN:仅有单个接口物理DOWN,则需要排查链路两端接口是否有金属弹片凹陷等硬件故障,如果接口故障可尝试使用其他空闲接口。

2.料--连接介质故障

(1) 故障原因描述

交换机物理接口有电口和光口,涉及的传输介质主要是RJ45-网线,光模块、光纤。当传输介质出现老化、破损或者光模块收发光异常等故障时,将会导致接口物理DOWN。

(2) 故障诊断操作步骤

电口连接介质故障:

  • 检查连线是否正确:保证对接两端接口使用同一根网线,如果经过跳线架请检查跳线是否正确,检查接口是否连接正确,同时检查是否存在接触不好及网线外部损坏的情况
  • 检查网线规格及长度是否符合标准:依据以太网相关标准,网线长度不能超过100m。对于GE电口,如果使用低于五类线的网线将不能够使GE电口以1000M速率UP,所有电口对接,均推荐使用五类线以上规格的网线对接
  • 检查网线内部线对状态是否正常:网线中4对线序中有部分出现损坏,将不能保证电口正常UP。检测网线质量,可以使用测线仪或者接口视图下执行virtual-cable-test 命令,检测线序对连接是否正常

如上图所示,如果回显中Pair state为OK表示正常;如果为其他状态(例如Open或short),建议您更换其他网线测试。”

光口连接介质故障:

  • 光模块是否属于华为认证光模块:华为公司在交换机产品发货的光模块标签上增加华为logo和相应标识,如图7所示,在产品电子标签、光模块信息里面都更新为“HUAWVEI” 厂家信息 对于非华为认证发货的光模块插入交换机设备中,会出现告警信息。告警格式如下:
ENTITYTRAP/3/OPTICALINVALID:OID oid] Optical Module is invalid.(Index=INTEGER),
EntityPhysicalIndex=INTEGER), PhysicalName= "OCTET", EntityTrapFaultID=[INTEGERJ)
  • 检查光模块状态是否正常:执行命令display transceiverinterface,检查两端设备上的光模块工作状态是否正常,主要查看收光功率、发光功率、电流值等,确定各项指标是否都在正常范围内。

(3) 故障恢复方法

电口连接介质故障:如果电口网线故障,建议直接更换网线

光口连接介质故障:

  • 如果使用的光模块为非华为认证光模块,请更换使用华为认证光模块。非认证光模块可靠性无法保证,可能导致业务不稳定。由非华为认证光模块导致的问题,华为将不承担责任,并在原则上不予以解决。
  • 如果执行display transceiverinterface命令查看光模块工作状态参数,按照表1所示标准结论判断参数否超出正常范围。

  • 如果发送光功率过低或过高:请更换光模块
  • 如果收光功率过低或过高:使用光功率计测试链路各部分的光功率亮减情况,对异常的部位进行修复。
  • 如果仍无法解决问题请更换光模块或者光纤,确保光模块传输距离和光纤类型符合组网需求.

3.法--连接介质操作方法错误

(1) 故障诊断操作步骤

进行设备间连接介质操作时,需要考虑光模块与光口是否匹配,光模块是否与光纤型号是否死配,光模块与光纤连线操作是否正确等、当接口出现物理DOWN时,可以从上述几个原因进行排查.

(2) 故障诊断操作步骤

  • 任意视图执行命今display device,查看设备型号及部件信息,其中框式设备主要可查看对应单板名称;

  • 登录硬件查询工县,查询当前使用的光模块类型是否和对应设备接口匹配以及光模块是否和光纤型号匹配;
  • 两端设备上均在任意视图下执行命令display transceiver interface,检查链路两端光模块参数是否一致;

  • 检查光纤连线方式是否正确,光模块一般包含发送端(TX)和接收端(RX)。光接口对接时需要两根光纤将一端光模块TX端与另一端RX连接,一端光模块RX端与另一端TX连接;

  • 判断接口是否为Combo接口,如果是Combo接口,检查接口使用方法是否正确,即接口当前工作模式是否和您当前接口连线是否一致。

如下图所示,Combo接口GE1/0/1在设备面板上对应两个接口: Combo光口和Combo电口。Combo光口和Combo电口不能同时工作。当用户需要对Combo光口或Combo电口进行属性配置时,都只需要进入同一接口视图GE1/0/1进行配置即可

任意视图下执行命令display interface,查看接口是否为Combo接口,以及当前工作模式是否正常.

图片图片

(3) 故障恢复方法

根据硬件查询工具,确保当前使用的光模块与光口匹配,光模块与光纤匹配,如果不一致,请更换相应部件。

如果当前接口为Combo接口,则Combo接口工作模式选定原则如下:

  • Combo电口没有连接网线,当Combo光口插上光模块时,则Combo接口选择光口模式
  • Combo电口已经连接网线,且Combo接口处于UP状态,此时即使Combo光口插上光模块Combo接口仍选择为电口模式。但是设备重启后,Combo接口工作模式将变为光口模式
  • Combo电口已经连接网线,目Combo接口处于DOWN状态,此时Combo光口插上光模块Combo接口将选择光口模式。
  • 当指定Combo接口工作模式为自动选择模式时(接口视图下执行comboport auto,默认设备Combo接口工作模式为auto ),系统将检测Combo光口是否有光模块插入,进行模式选择:

综上所述,Combo接口工作模式为自动选择模式时,只要Combo光口已插上光模块,则设备重启后,Combo接口都将选择光口模式。

当Combo接口的工作模式设置为强制模式时,需要根据本端与对端设备连接的接口类型进行配置:

  • 如果本端Combo电口与对端电口相连,则需要强制指定Combo接口的工作模式为copper,即接视图下执行combo-port copper.
  • 如果本端Combo光口与对端光口相连,则需要制指定Combo接口的工作模式为fber,即接视图下执行combo-port fiber.

综上所述,当确定正确的传输介质后(光纤或者网线)后,就可以确定Combo口正确的工作模式您可以直接使用命令combo-port{copper|fiber],强制配置接口工作模式和连接介质保持致即可。

4.环--环境因素导致的故障

(1) 原因描述

交换机使用场景复杂多样,设备可以处于网络中任意一个层级。当交换机及其连接介质由于环境因素导致异常时接口状态也可能物理DOWN

(2) 故障诊断操作步骤

  • 检查机房温度及湿度状况:S交换机工作环境温度:0C~45C,对湿度应在5%RH~95%RH之间,不结露
  • 检查线缆布放状况:电源线与业务线缆分开布放。不能出现强弱电线缆并行的情况,防止干扰。检查是否有高温或者机架磨损导致网线破损老化的问题

(3) 恢复方法

  • 若机房的环境温度长期不能满足要求,应考虑检修或更换机房的空调系统。若机房的相对湿度过大,应考虑为机房安装除湿设备;
  • 若机房的相对湿度过小,应考虑为机房安装加湿设备,若出现强弱电线缆并行现象,请重新部署线缆走向,强弱电线缆分离。如因环境因素导致网线损伤老化,请更换网线。
责任编辑:赵宁宁 来源: 攻城狮成长日记
相关推荐

2023-08-14 10:35:19

以太网局域网

2023-12-10 16:54:39

以太网交换技术

2019-05-22 09:51:28

网络故障

2011-07-29 17:20:36

无线线网网络

2023-08-07 10:31:03

以太网供电照明

2011-07-04 16:28:43

Windows XP故

2010-04-20 11:56:30

Oracle物理结构故

2011-01-24 13:42:27

网络故障网络故障修复

2020-12-28 08:10:26

HTTPTCPIP

2009-05-19 16:40:41

TTL网络故障科来软件

2011-03-30 16:12:27

POS接口光接口

2011-08-25 13:07:45

2011-08-29 10:45:38

网络故障无线网络连接故障

2023-07-05 14:22:18

网络以太网

2010-09-28 13:21:11

无线AP

2009-09-05 11:10:26

无线AP网络故障

2010-09-09 10:11:11

无线网络故障

2009-01-07 09:19:00

系统服务网络故障

2009-12-25 10:31:31

Linux网络故障
点赞
收藏

51CTO技术栈公众号