以太网 Mac 和 Phy 层问题的“对症下药”攻略

网络 网络管理
在以太网中,MAC(Media Access Control,媒体访问控制)层是数据链路层的重要组成部分,肩负着诸多关键功能。首先,它负责控制与连接物理层的物理介质,是数据链路层与物理层交互的关键桥梁,决定着数据如何流向物理层进行传输。

在当今数字化连接的世界里,以太网作为网络通信的基石,支撑着我们日常的互联网生活、企业的数据传输以及工业领域的自动化控制等方方面面。然而,就像一座大厦的根基可能会出现裂缝一样,以太网的 MAC(Media Access Control)层和 PHY(Physical Layer)层也常常会面临各种各样的问题,这些问题犹如隐藏在网络中的 “暗礁”,威胁着数据传输的稳定与流畅。

从数据传输的丢包、误码,到连接的不稳定、速率受限,这些 MAC 和 PHY 层的问题可能会在不经意间给我们的工作和生活带来诸多困扰。但不必担忧,如同航海者有应对暗礁的方法和技巧,在网络的世界里,我们也拥有一系列行之有效的解决方案,来化解这些 MAC 和 PHY 层的难题,让以太网的传输之河重新恢复清澈与顺畅。接下来,就让我们一同深入探讨这些解决方案的奥秘。

一、简介

1.1什么是MAC 层

在以太网中,MAC(Media Access Control,媒体访问控制)层是数据链路层的重要组成部分,肩负着诸多关键功能。首先,它负责控制与连接物理层的物理介质,是数据链路层与物理层交互的关键桥梁,决定着数据如何流向物理层进行传输。例如,在发送数据时,MAC 协议会预先判断当下是否可以发送数据,如果条件允许,就会给数据添加上相应的控制信息,然后按照规定的格式将数据发送到物理层;而在接收数据时,MAC 协议则会率先判断输入的信息是否存在传输错误,要是没有错误,才会去掉控制信息,并将数据传递至上层的 LLC(逻辑链路控制)层。

其次,MAC 层承担着对数据进行封装成帧的任务。当来自上层(像 LLC 层或网络层)的数据抵达 MAC 层时,它会给这些数据添加上 MAC 报头以及可能有的报尾,从而形成一个完整的 MAC 帧。与之相对应的,在接收到 MAC 帧后,MAC 层也会去除帧的报头和报尾,提取出其中有用的数据再传递给上层,以此完成解封装操作。再者,处理目标和源 MAC 地址也是 MAC 层的重要职责所在。MAC 地址作为全球唯一的硬件地址,被 MAC 层用于识别网络上的各个设备,以此来明确数据究竟是从哪个设备发出,又该发往哪个设备,实现精准的数据传输定位。

最后,MAC 层还具备进行传输错误校准的功能,它能够通过循环冗余校验(CRC)等技术来检测数据在传输过程中是否出现错误,一旦检测到错误,通常会将出现问题的帧丢弃,并可能要求重传,以此确保数据传输的完整性和准确性,保障局域网中数据可以正确、高效且可靠地传输。

1.2什么是PHY 层

PHY 层作为实现 OSI 模型中物理层功能的关键部分,在以太网数据传输过程中有着不可或缺的作用。

一方面,PHY 层会对 MAC 传来的数据做进一步的编码处理。比如,在不同的以太网标准下,编码方式各有不同,在 100Base-TX 的标准下,MAC 层的数据首先要经过 4B/5B 编码,然后进行串并转换,转换后的串行码流接着要经过 NRZI 编码、扰码以及 MLT-3 编码等一系列操作,之后才会进行后续的传输流程;而在接收数据时,则会按照相反的顺序进行解码等操作,把接收到的数据还原成 MAC 层能够识别处理的形式。

另一方面,PHY 层承担着数字信号与模拟信号的转化工作。在发送数据时,它会把从 MAC 层接收到的数字信号转换为模拟信号,以便能够在物理介质(如网线等)上进行传输;在接收外部传来的数据时,则是将模拟信号转换回数字信号,再传递给 MAC 层进行后续处理。

同时,PHY 层包含了多个子层,各子层有着明确的分工。其中,PCS(物理编码子层)主要负责对信号的编码译码、收发处理、管理和控制等工作,遵循 ISO/IEC8802-3 和 IEEE802.3 标准,像在 100Base-TX 速率下对信号进行相应的编译码等操作就是 PCS 子层的职责所在;PMA(物理介质连接子层)进一步将 PCS 编码向各种媒介进行传送,完成串并、并串转化,使得数据能够适配不同的物理介质传输要求;PMD(物理介质相关子层)负责完成物理连接,确保数据能在对应的物理介质上稳定传输。这些子层相互协作,共同保障了物理层数据传输功能的实现。

1.3MAC 和 PHY 层的连接方式

在以太网中,MAC 与 PHY 层之间通过特定的接口来实现连接,其中 MII(Media Independent Interface,介质独立接口)及其衍生版本和 SMI(Serial Management Interface,串行管理接口)接口起着关键作用。他们之间的关系是pci总线接mac总线,mac接 phy,phy接网线(当然也不是直接接上的,还有一个变压装置)。

MII 接口作为 MAC 与 PHY 连接的标准接口,有着重要的作用。它包含了多个衍生版本,像 GMII(Gigabit Media Independent Interface,千兆媒体独立接口)、RMII(Reduced Media Independant Interface,简化媒体独立接口)等,以适应不同的数据传输速率和应用场景需求。从功能角度来讲,MII 接口涵盖了从 MAC 层到 PHY 层的发送数据接口以及从 PHY 层到 MAC 层的接收数据接口,使得数据能够在 MAC 和 PHY 层之间实现双向传输。例如,MII 接口在 100Mbps 速率下,时钟频率为 25MHz,数据接口总共需要 16 个信号,支持 10Mb/s 和 100Mb/s 的数据速率,还能支持全双工、半双工两种工作模式,发送和接收数据时采用 4bit 方式;而 RMII 是简化的 MII 接口,在数据的收发上它比 MII 接口少了一倍的信号线(2 数据位),一般要求是 50MHz 的总线时钟,同样支持 10Mbps 和 100Mbps 的总线接口速度,适用于一些对信号线数量有要求的应用场景;GMII 则是为了支持千兆网口而出现的接口,现在比较常用的 RGMII 在其基础上减小了 MAC 和 PHY 之间的引脚数量,采用数据信号和控制信号混合在一起的方式,并且在工作时钟的上升沿和下降沿同时采样,满足了千兆以太网的数据传输要求。

另外,SMI 接口在 MAC 对 PHY 的控制方面有着关键作用。SMI 接口由两根线组成,双工模式运行,其中 MDC 为时钟线,MDIO 为数据线,它也支持通过总线访问多个不同的 phy 芯片。在这个接口体系下,MDIO 总线只支持 MAC 作为主设备,PHY 作为从设备,其基本特性包括两线制、特定的时钟频率(如 2.5MHz)以及总线制通信方式,且可同时接入的 PHY 数量为 32 个。通过 SMI 接口,MAC 芯片能够主动地轮询 PHY 层芯片,获取其状态信息,比如 PHY 芯片当前的连接速度、双工的能力等,并且可以发出相应的命令信息,从而实现对 PHY 工作状态的确定和控制,保障整个以太网通信系统稳定有序地运行。

二、常见问题大揭秘

2.1硬件连接相关问题

在以太网 MAC 和 PHY 层的实际应用中,硬件连接方面出现的问题往往会影响二者之间的正常通信。常见的情况包括焊接错误、线路损坏以及接口松动等。

比如焊接错误,可能是在安装 PHY 芯片时,引脚焊接出现虚焊或者连焊的情况。虚焊会导致芯片引脚与电路板之间接触不良,信号传输就会时断时续;连焊则可能造成引脚之间的短路,使信号传输混乱,进而影响 MAC 和 PHY 层之间的数据交互。像有的工程师在调试过程中发现设备通信异常,经过仔细排查,发现是 PHY 芯片的某个关键引脚存在虚焊,重新焊接后问题得到部分改善。

线路损坏也是一个不容忽视的问题。网线长期使用或者受到外力拉扯、弯折等,内部的导线可能会出现断裂情况,使得从 PHY 层转换后的模拟信号无法正常通过网线传输到相应设备,或者 MAC 层传出的数字信号不能顺利到达 PHY 层进行下一步处理。另外,若电路板上连接 MAC 和 PHY 层的线路存在短路、断路等故障,同样会阻断信号的正常传递。

接口松动同样较为常见,例如 RJ45 接口(常用网口座子)如果没有插紧,或者长时间使用后出现松动,会导致物理连接不稳定,进而影响数据的发送和接收。还有 MII、RMII、GMII 等 MAC 和 PHY 层之间的连接接口,若松动也会造成数据传输出现错误或者中断。

当遇到因硬件连接导致的 MAC 和 PHY 层通信问题时,排查思路如下:

首先,直观检查硬件连接情况,查看是否有明显的线路破损、接口松动迹象,芯片焊接是否牢固、引脚有无异常等。其次,借助专业工具进行检测,比如使用万用表测量线路的通断情况,判断是否存在断路;对于电源线路,检查电压是否正常传输到相应芯片,确保供电正常;还可以用示波器查看信号线上的信号波形,判断信号质量是否符合要求等。通过这些基本的排查方向,逐步定位并解决硬件连接方面出现的问题,恢复 MAC 和 PHY 层之间的正常通信。

2.2电源与复位问题

电源供应以及复位电路的状态对于 MAC 和 PHY 层的工作有着至关重要的影响。

电源供应不稳定时,可能出现多种不良情况。例如,若电源电压出现波动,过高的电压可能会损坏 PHY 芯片内部的电子元件,而过低的电压则可能导致 PHY 芯片无法正常工作,像不能正常挂载到系统中,使得 MAC 层无法与之建立有效的通信连接。又比如电源存在纹波干扰,会影响信号的准确性,导致 PHY 层在进行数字信号与模拟信号转换等工作时出现错误,进而影响整个数据传输流程。以一些工业环境下的以太网设备为例,由于现场存在较多大型电机等设备,电源容易受到干扰,PHY 芯片就时常因为电源不稳定而出现工作异常,无法准确将 MAC 层传来的数字信号转换为适合网线传输的模拟信号,导致数据传输失败。

复位电路异常同样会引发诸多问题。当复位电路不能正常工作时,比如复位信号无法正常产生或者复位后不能按照要求及时抬起复位信号,PHY 芯片就可能无法完成初始化,不能进入正常的工作状态。在一些嵌入式设备中,复位电路设计不合理或者元件出现故障,会使得 PHY 芯片在复位后一直处于异常状态,即使电源等其他条件正常,也无法与 MAC 层协同工作,像不能响应 MAC 层通过 SMI 接口发来的控制命令,无法完成诸如自动协商速度、双工模式等操作。

针对电源与复位问题,可以采取以下解决思路:

对于电源问题,一方面要确保供电电源本身的稳定性,可使用稳压电源模块,减少外部因素对电源电压的干扰;另一方面,在电路设计阶段,合理布置滤波电容等元件,对电源进行滤波处理,降低纹波系数,保证电源输出的纯净性。同时,要按照芯片手册要求,严格匹配电源的电压、电流等参数,避免因参数不匹配导致芯片工作异常。

对于复位电路问题,首先要检查复位电路中的各个元件,如复位芯片、电阻、电容等是否正常工作,有无损坏或者焊接不良等情况。然后,通过示波器等工具查看复位信号的波形,确认复位信号的电平维持时间、上升沿和下降沿等是否满足 PHY 芯片的要求,若不符合,要对相应电路进行调整和修复,确保复位电路能够正常完成复位操作,使 PHY 芯片以及 MAC 层能在正确的初始状态下开始工作。

2.3配置与驱动问题

在 MAC 和 PHY 层的应用中,配置与驱动方面出现问题也会对二者的通讯造成阻碍。

驱动程序如果没有正确设置控制寄存器位,会导致 MAC 和 PHY 无法正常通讯。例如,当没有设置好相应位来使 MAC 层知晓 PHY 层的链路状态已准备好时,即便物理链路正常,MAC 层也会因得不到准确信息而无法与 PHY 层进行数据交互,最终收不到任何数据。而且在速度和双工模式的协商上,如果驱动程序配置不当,MAC 和 PHY 层不能协商出一致的速度(如 10Mbps、100Mbps、1000Mbps 等)以及双工模式(半双工或全双工),就会导致数据传输出现混乱或者根本无法传输。像有的网络设备在更换了新的 PHY 芯片后,由于驱动没有及时更新适配,没有正确配置寄存器来与新芯片协同工作,结果出现设备之间无法正常通信的情况。

要解决这类配置与驱动问题,可以从以下方面入手:

步骤一是修改驱动程序,当使用了不同厂家或者不同型号的 PHY 芯片时,要根据芯片的特性以及手册要求,对驱动中的相关代码进行调整,确保驱动能够准确地与 PHY 芯片配合工作。例如,不同厂家的 PHY 芯片对于控制寄存器的定义和操作方式可能存在差异,需要针对性地修改驱动中对寄存器读写等操作的代码部分,使其能正确配置 PHY 芯片的工作模式、速度等参数。

步骤二是正确配置寄存器,要深入了解 MAC 和 PHY 层所涉及的各类寄存器功能,比如通过 SMI 接口读写 PHY 芯片的寄存器,来设置 PHY 芯片的工作状态、获取其状态信息等。按照标准的 IEEE 规范以及芯片手册的具体说明,准确地向寄存器写入相应的值,实现对 MAC 和 PHY 层的正确配置,保障它们之间能够顺利通讯、协商出合适的速度和双工模式,从而实现以太网数据的稳定、高效传输。

如果操作系统没有加载网卡驱动,网卡虽然在系统设备树上,但网卡接口创建不了,那网卡实际能不能接收到数据?

这里面有很多细节, 我根据Intel网卡的Spec大概写了写, 想尽量写的通俗一些,所以没有刻意用Spec里的术语,另外本文虽然讲的是MAC/PHY,但光口卡的(SERDES)也是类似的。

1. PCI设备做reset以后进入D0uninitialized(非初始化的D0状态, 参考PCI电源管理规范),此时网卡的MAC和DMA都不工作,PHY是工作在一个特殊的低电源状态的。

2. 操作系统创建设备树时,初始化这个设备,PCI命令寄存器的 Memory Access Enable or the I/O Access Enable bit会被enable, 这就是D0active。此时PHY/MAC就能了。

3. PHY被使能应该就可以接收物理链路上的数据了,否则不能收到FLP/NLP, PHY就不能建立物理连接。但这类包一般是流量间歇发送的.

4. 驱动程序一般要通过寄存器来控制PHY, 比如自动协商speed/duplex, 查询物理链路的状态Link up/down。

5. MAC被使能后, 如果没有驱动设置控制寄存器的一个位(CTRL.SLU )的话, MAC和PHY是不能通讯的, 就是说MAC不知道PHY的link已经ready, 所以收不到任何数据的。这位设置以后, PHY完成自协商, 网卡才会有个Link change的中断,知道物理连接已经Link UP了。

6. 即使Link已经UP, MAC还需要enable接收器的一个位(RCTL.RXEN ),包才可以被接收进来,如果网卡被reset,这位是0,意味着所有的包都会被直接drop掉,不会存入网卡的 FIFO。老网卡在驱动退出前利用这个关掉接收。Intel的最新千兆网卡发送接收队列的动态配置就是依靠这个位的,重新配置的过程一定要关掉流量。

7. 无论驱动加载与否, 发生reset后,网卡EEPOM里的mac地址会写入网卡的MAC地址过滤寄存器, 驱动可以去修改这个寄存器,现代网卡通常支持很多MAC地址,也就是说,MAC地址是可以被软件设置的。例如,Intel的千兆网卡就支持16个单播 MAC地址,但只有1个是存在EEPROM里的,其它是软件声称和设置的。

8. 但如果驱动没有加载,网卡已经在设备树上,操作系统完成了步骤1-2的初始化,此时网卡的PHY应该是工作的,但因为没有人设置控制位(CTRL.SLU)来让MAC和PHY建立联系,所以MAC是不收包的。这个控制位在reset时会再设置成0。

9. PHY可以被软件设置加电和断电, 断电状态除了接收管理命令以外,不会接收数据。另外,PHY还能工作在Smart Power Down模式下,link down就进入省电状态。

10. 有些多口网卡,多个网口共享一个PHY, 所以BIOS里设置disbale了某个网口, 也未必会把PHY的电源关掉,反过来,也要小心地关掉PHY的电源。

三、通讯方式

MII(Media Independent Interface)即媒体独立接口,MII接口是MAC与PHY连接的标准接口。它是IEEE-802.3定义的以太网行业标准。MII接口提供了MAC与PHY之间、PHY与STA(Station Management)之间的互联技术。媒体独立表明在不对MAC硬件重新设计或替换的情况下,任何类型的PHY设备都可以正常工作.它包括一个数据接口,以及一个MAC和PHY之间的管理接口。MII接口有MII、RMII、SMII、SSMII、SSSMII、GMII、SGMII、RGMII等。这里简要介绍其中的MII和RGMII。

MII接口主要包括以下三个部分:

  • 从MAC层到PHY层的发送数据接口
  • 从PHY层到MAC层的接收数据接口
  • 从MAC层和PHY层之间寄存器控制和信息获取的MDIO接口

MII 数据接口总共需要 16 个信号。MII的时钟为25MHz,传输速率为10/100Mbps。所以MII的特性如下:

  • 支持10Mb/s和100Mb/s的数据速率
  • 100M工作模式下,参考时钟是25MHz;10M工作模式下,信号参考时钟是2.5MHz
  • 支持全双工、半双工两种工作模式
  • 发送和接收数据时采用,4bit方式

RMII是简化的MII接口,在数据的收发上它比MII接口少了一倍的信号线(2数据位),所以它一般要求是50MHz的总线时钟。RMII一般用在多端口的交换机,所有的数据端口公用一个时钟用于所有端口的收发,这里就节省了不少的端口数目.RMII的一个端口要求7个数据线,比MII少了一倍,所以交换机能够接入多一倍数据的端口.和MII一样,RMII支持10Mbps和100Mbps的总线接口速度.

后来为了支持千兆网口,也就开始有了千兆网的MII接口,也就是GMII接口。现在比较常用的是RGMII,减小了MAC和PHY之间的引脚数量。数据信号和控制信号混合在一起,并且在工作时钟的上升沿和下降沿同时采样,其对应关系图如下:

  • 10M带宽对应的是2.5MHz,因为4bit*2.5M=10Mbps
  • 100M带宽对应的是25MHz,因为4bit*25M=100Mbps

1000M带宽对应的是125MHz,因为250MHz频率太高,所以采用双边沿采样技术(会带来设计复杂度)。4bit125M2=1000Mbps

SMI是MAC内核访问PHY寄存器接口,它由两根线组成,双工,MDC为时钟,MDIO为双向数据通信,原理上跟I2C总线很类似,也可以通过总线访问多个不同的phy。

MDC/MDIO基本特性:

  • 两线制:MDC(时钟线)和MDIO(数据线)。
  • 时钟频率:2.5MHz
  • 通信方式:总线制,可同时接入的PHY数量为32个
  • 通过SMI接口,MAC芯片主动的轮询PHY层芯片,获得状态信息,并发出命令信息。

当PHY芯片发送数据,接收到MAC层发送过来的数字信号,然后转换成模拟信号,通过MDI接口传输出去。但是网线传输的距离又很长,有时候需要送到100米甚至更远的地址,那么就会导致信号的流失。而且外网线与芯片直接相连电磁感应和静电,也很容易导致芯片的损坏,所以就要使用网络变压器,其主要作用是:

传输数据,它把PHY送出来的差分信号用差模耦合的线圈耦合滤波以增强信号,并且通过电磁场的转换耦合到不同电平的连接网线的另外一端;

隔离网线连接的不同网络设备间的不同电平,以防止不同电压通过网线传输损坏设备;还能使芯片端与外部隔离,抗干扰能力大大增强,而且对芯片增加了很大的保护作用,保护PHY免遭由于电气失误而引起的损坏(如雷击)。

3.1MAC

MAC(Media Access Control),即媒体访问控制子层协议,该部分有两个概念:MAC可以是一个硬件控制器以及MAC通讯协议。该协议位于OSI七层协议中数据链路层的下半部分,主要是负责控制与连接物理层的物理介质。

MAC(Media Access Control),即媒体访问控制子层协议,该部分有两个概念:MAC可以是一个硬件控制器以及MAC通讯协议。该协议位于OSI七层协议中数据链路层的下半部分,主要是负责控制与连接物理层的物理介质。

发送数据:MAC协议可以事先判断是否可以发送数据,如果可以发送将数据加上一些控制信息,最后将数据以及控制信息以规定的格式发送到物理层

接收数据:MAC协议首先判断输入的信息并是否发生传输错误,如果没有错误,则去掉控制信息后发送至LLC(逻辑链路控制)层。

图片图片

PHY物理层位于OSI最底层,物理层协议定义电气信号、线的状态、时钟要求、数据编码和数据传输用的连接器。

图片图片

MDI口是快速以太网100BASE-T定义的与介质有关接口(Media Dependent Interface)。MDI是指通过收发器发送的100BASE-T信号,即100BASE-TX、FX、T4或T2信号。将集线器连接网络接口卡时,其发送和接收对通常是相互连接的。集线器之间连接时,通常需要一条跨接电缆,其中的发送和接收对是反接的。

MDI是正常的UTP或STP连接,而MDI-X连接器的发送和接收对是在内部反接的,这就使得不同的设备(如集线器-集线器或集电器-交换机),可以利用常规的UTP或STP电缆实现背靠背的级联。

⑴MII接口

MII(Media Independent Interface)即媒体独立接口,MII接口是MAC与PHY连接的标准接口。它是IEEE-802.3定义的以太网行业标准。MII接口提供了MAC与PHY之间、PHY与STA(Station Management)之间的互联技术。媒体独立表明在不对MAC硬件重新设计或替换的情况下,任何类型的PHY设备都可以正常工作.它包括一个数据接口,以及一个MAC和PHY之间的管理接口。MII接口有MII、RMII、SMII、SSMII、SSSMII、GMII、SGMII、RGMII等。这里简要介绍其中的MII和RGMII。

MII接口主要包括以下三个部分:

  • 从MAC层到PHY层的发送数据接口
  • 从PHY层到MAC层的接收数据接口
  • 从MAC层和PHY层之间寄存器控制和信息获取的MDIO接口

首先来看看MII的MAC层定义接口:MII 数据接口总共需要 16 个信号,包括 TX_ER,TXD[3:0],TX_EN,TX_CLK,COL,RXD[3:0],RX_ER,RX_CLK,CRS,RX_DV 等。MII的时钟为25MHz,传输速率为10/100Mbps。所以MII的特性如下:

  • 支持10Mb/s和100Mb/s的数据速率
  • 100M工作模式下,参考时钟是25MHz;10M工作模式下,信号参考时钟是2.5MHz
  • 支持全双工、半双工两种工作模式
  • 发送和接收数据时采用,4bit方式

RMII的用途:

RMII是简化的MII接口,在数据的收发上它比MII接口少了一倍的信号线(2数据位),所以它一般要求是50MHz的总线时钟。RMII一般用在多端口的交换机,所有的数据端口公用一个时钟用于所有端口的收发,这里就节省了不少的端口数目.RMII的一个端口要求7个数据线,比MII少了一倍,所以交换机能够接入多一倍数据的端口.和MII一样,RMII支持10Mbps和100Mbps的总线接口速度.

后来为了支持千兆网口,也就开始有了千兆网的MII接口,也就是GMII接口。现在比较常用的是RGMII,减小了MAC和PHY之间的引脚数量。数据信号和控制信号混合在一起,并且在工作时钟的上升沿和下降沿同时采样,其对应关系图如下:

  • 10M带宽对应的是2.5MHz,因为4bit*2.5M=10Mbps
  • 100M带宽对应的是25MHz,因为4bit*25M=100Mbps
  • 1000M带宽对应的是125MHz,因为250MHz频率太高,所以采用双边沿采样技术(会带来设计复杂度)。4bit125M2=1000Mbps

⑵SMI接口

SMI是MAC内核访问PHY寄存器接口,它由两根线组成,双工,MDC为时钟,MDIO为双向数据通信,原理上跟I2C总线很类似,也可以通过总线访问多个不同的phy。

MDC/MDIO基本特性:

  • 两线制:MDC(时钟线)和MDIO(数据线)。
  • 时钟频率:2.5MHz
  • 通信方式:总线制,可同时接入的PHY数量为32个
  • 通过SMI接口,MAC芯片主动的轮询PHY层芯片,获得状态信息,并发出命令信息。

3.2PHY

物理层位于OSI最底层,物理层协议定义电气信号、线的状态、时钟要求、数据编码和数据传输用的连接器。物理层的器件称为PHY。

图片

PHY是物理接口收发器,它实现OSI模型的物理层。IEEE-802.3标准定义了以太网PHY包括MII/GMII(介质独立接口)子层、PCS(物理编码子层)、PMA(物理介质附加)子层、PMD(物理介质相关)子层、MDI子层。

⑴MDI

MDI口是快速以太网100BASE-T定义的与介质有关接口(Media Dependent Interface)。MDI是指通过收发器发送的100BASE-T信号,即100BASE-TX、FX、T4或T2信号。将集线器连接网络接口卡时,其发送和接收对通常是相互连接的。集线器之间连接时,通常需要一条跨接电缆,其中的发送和接收对是反接的。MDI是正常的UTP或STP连接,而MDI-X连接器的发送和接收对是在内部反接的,这就使得不同的设备(如集线器-集线器或集电器-交换机),可以利用常规的UTP或STP电缆实现背靠背的级联。”

⑵PHY基础知识

PHY是IEEE 802.3规定的一个标准模块,SOC可以通过MDIO对PHY进行配置或者读取phy相关状态,PHY内部寄存器必须满足

PHY芯片的寄存器地址空间是5位,一般由外部硬件连接决定。

地址空间031共32个寄存器,IEEE定义了015这16个寄存器的功能,16-31这16个寄存器由厂商自行实现。也就是说不管哪个厂商的PHY芯片,其中0~15这16个寄存器是一模一样的。

仅靠这 16个寄存器完全可以驱动起PHY芯片,至少能保证基本的网络数据通信。因此 Linux 内核有通用 PHY 驱动,按道理来讲,不管你使用的是哪个厂家的 PHY 芯片,都可以使用 Linux 的这个通用 PHY 驱动来验证网络工作是否正常。事实上在实际开发中可能会遇到一些其他的问题导致 Linux 内核的通用 PHY 驱动工作不正常,这个时候就需要驱动开发人员去调试了。

随着现在PHY芯片性能越来越强大,32个寄存器已经无法满足厂商的需求,因此很多厂商采用了分页机制来开展寄存器地址空间,以求定义更多的寄存器。这些多出来的几次器可以实现厂商特有的一些技术,因此在Linux内核里面可以看到很多具体的PHY芯片驱动源码。

四、对症下药有妙招

4.1硬件层面解决方案

当遇到硬件相关问题时,以下这些方法或许能帮助你恢复正常的硬件运行状态:

重新焊接:对于焊接错误导致的 MAC 和 PHY 层通信故障,像是引脚虚焊或者连焊情况,需要进行重新焊接操作。例如,若发现 PHY 芯片引脚存在虚焊,使用专业的焊接工具,将虚焊的引脚重新补焊牢固,确保芯片引脚与电路板之间接触良好,使信号可以稳定传输;而对于连焊问题,则要小心地将短路的引脚分开,并清理干净多余的焊锡,保证各引脚之间电气连接正常。

检查线路完整性:线路方面,无论是网线还是电路板上连接 MAC 和 PHY 层的线路,都要仔细排查。针对网线,可顺着网线的走向,查看其外皮是否有破损、弯折过度的地方,若怀疑内部导线断裂,可用万用表的电阻档测量网线不同线芯的电阻值,正常情况下应该是较小的阻值,如果阻值无穷大则意味着线芯可能断裂,此时就需要更换新的网线。对于电路板上的线路,同样借助万用表的通断测试功能,检查是否存在断路或者短路故障,若发现线路有损坏痕迹,要及时修复或者重新布线,保障信号能正常通过线路传输。

更换电源模块:电源供应不稳定影响 MAC 和 PHY 层工作时,考虑更换电源模块。比如在一些工业环境中,由于电源容易受到干扰,若原本的电源模块无法提供稳定的电压输出,可选择具有更好抗干扰能力、稳压性能更强的电源模块进行替换,确保输出的电压符合 PHY 芯片以及 MAC 芯片正常工作所要求的范围,避免因电压波动、纹波干扰等问题造成芯片工作异常,影响数据传输。

修复复位电路:复位电路出现异常,致使 PHY 芯片无法正常初始化进入工作状态时,要对复位电路进行修复。首先,全面检查复位电路中的各个元件,像复位芯片、电阻、电容等,查看是否有损坏或者焊接不良的情况,如有损坏的元件,按照原规格进行更换;然后,使用示波器查看复位信号的波形,确认复位信号的电平维持时间、上升沿和下降沿等是否满足 PHY 芯片的要求,若不符合,通过调整相关元件参数或者修复电路连接等方式进行修正,保证复位电路能正常完成复位操作,使 PHY 芯片以及 MAC 层能在正确的初始状态下开始工作。

4.2软件层面解决方案

在处理配置与驱动相关问题时,下面这些软件操作手段能助力 MAC 和 PHY 层协调工作,实现正常的数据传输:

读写寄存器:通过 SMI 接口读写 PHY 芯片的寄存器是很关键的操作。不同厂家、不同型号的 PHY 芯片寄存器定义和操作方式会有差异,要依据芯片手册的具体说明来进行读写。比如,为了获取 PHY 芯片当前的连接速度、双工的能力等状态信息,可按照相应的寄存器地址和读取规则,通过 SMI 接口从对应的寄存器中读取数据;而要设置 PHY 芯片的工作状态,像配置其工作模式、速度等参数时,则向相应的寄存器写入符合 IEEE 规范以及芯片要求的值,确保 MAC 和 PHY 层能按照设定好的状态进行工作,保障数据传输的正常开展。

更新驱动程序版本:当更换了不同厂家或者不同型号的 PHY 芯片后,原有的驱动程序可能无法适配新芯片,这时就需要更新驱动程序版本。根据新芯片的特性以及手册要求,对驱动中的相关代码进行调整修改,尤其是针对控制寄存器读写等操作的代码部分,使其能准确地与新的 PHY 芯片配合工作,实现诸如自动协商速度、双工模式等功能,避免因驱动不匹配导致 MAC 和 PHY 无法正常通讯,数据传输出现混乱或者中断的情况。

按照规范重新进行自动协商:通常情况下,MAC 和 PHY 芯片是默认开启自动协商功能的,但有时也可能出现该功能不能使用的状况。此时,需要确认 MAC 和 PHY 芯片是否支持自动协商功能的使用,如果支持但未正常协商,就要按照 IEEE 规范重新进行自动协商操作。比如在一些特定的网络设备组合中,若出现自动协商失败导致无法确定合适的数据传输速度和双工模式的问题,可以手动配置相关参数,引导 MAC 和 PHY 层重新进行协商,促使它们达成一致的、能保障数据稳定传输的工作模式,像协商出 100Mbps 的速度以及全双工模式等。

4.3综合排查与维护建议

在遇到 MAC 和 PHY 层问题时,进行系统性的排查是至关重要的,以下是一些建议:

⑴系统性排查步骤

先从硬件外观、连接情况查起:直观查看硬件连接情况,检查是否有明显的线路破损、接口松动迹象,芯片焊接是否牢固、引脚有无异常等。比如查看 RJ45 接口是否插紧,MII、RMII、GMII 等 MAC 和 PHY 层之间的连接接口有没有松动;再看 PHY 芯片的焊接状况,有无虚焊、连焊或者引脚损坏的情况。同时,观察电路板上相关线路是否存在短路、断路等问题,对于网线也要留意其外皮完整性以及线芯是否有断裂风险。

再到软件配置、驱动状态等方面依次排查:在软件方面,先检查驱动程序是否正确安装以及是否适配当前的 MAC 和 PHY 芯片,查看驱动中对寄存器的配置是否符合芯片要求,例如控制寄存器位有没有正确设置来使 MAC 层知晓 PHY 层的链路状态等关键信息。然后通过相关工具查看软件层面的状态,比如利用操作系统自带的网络管理工具或者专业的网络检测软件,查看 MAC 和 PHY 层的工作状态参数,确认速度、双工模式等是否协商成功,数据传输是否正常等。

⑵日常维护建议

定期检查硬件连接:每隔一段时间,对网线、接口以及芯片引脚等硬件连接部位进行检查,及时发现并处理松动、破损等潜在问题,避免因长时间积累导致严重的通信故障。

做好电源管理与监控:确保电源供应稳定,对于容易受到干扰的使用环境,可以增加电源滤波、稳压设备;同时,定期检测电源电压、纹波等参数,及时发现电源异常情况并进行处理,防止因电源问题影响 MAC 和 PHY 层芯片工作。

及时更新驱动和固件:关注 MAC 和 PHY 芯片厂家发布的驱动更新以及固件升级信息,及时进行更新操作,以保证设备能适配最新的功能优化和兼容性改进,减少因软件版本过旧引发的问题。

备份重要配置信息:将 MAC 和 PHY 层相关的正确配置参数、寄存器设置值等重要信息进行备份,当出现故障需要重新配置或者恢复设备时,可以快速准确地还原到正常的工作。

责任编辑:武晓燕 来源: 深度Linux
相关推荐

2010-08-24 13:28:36

IP地址冲突现象

2009-01-11 12:12:41

2021-04-12 13:20:43

WiFi路由器网络

2010-02-24 16:00:29

2019-01-08 07:45:54

2013-12-04 10:34:34

2012-04-16 15:16:32

2010-01-15 11:45:10

交换机

2009-03-05 09:28:00

VPN连接Vista系统局域网

2011-06-28 13:05:37

2020-09-23 14:59:12

大数据

2011-03-22 09:32:10

2024-05-20 11:51:47

架构重构接口

2016-11-04 16:29:15

移动安全移动设备风险

2011-12-01 14:43:25

喷墨打印机故障与解决

2017-07-06 12:33:19

联想超融合

2011-12-15 10:26:34

Broadcom以太网PHY

2011-10-12 14:43:00

Broadcom汽车PHY

2013-12-25 13:03:08

校园网出口A10
点赞
收藏

51CTO技术栈公众号