数据中心网络维护三把斧

网络
网络是数据中心里是最为重要的组成部分,也是技术最为复杂的部分,要对网络运行进行日常维护,故障处理需要掌握不少本领才行。

网络是数据中心里是最为重要的组成部分,也是技术最为复杂的部分,要对网络运行进行日常维护,故障处理需要掌握不少本领才行。数据中心网络分为存储网和数据网,存储网采用的是光纤通道协议,数据网采用的是以太网协议。与以太网协议相比,光纤通道协议要简单得多,只要完成二层互通即可。以太网协议相对要复杂,各种协议标准琳琅满目,让人丈二和尚摸不到头脑,一个人要将所有协议吃透、吃精通根本不可能。那么,面对数据中心里复杂的网路世界,怎么才能做好维护呢?本文总结出了网络维护的三把斧,用好这三把斧,就有能力成为数据中心网络技术专家。

[[178582]]

通常做网络维护工作有两大块,一是日常的检查,发现隐患及时消除;二是故障处理,出现故障能够及时恢复业务,同时还能定位出原因,避免相同的故障再出。日常的检查比较简单,就算应付了事也能过关。不过有句成语叫“千里之提,溃于蚁穴”,很多故障正是因为平时的疏忽,对各种小的隐患不重视,最终患酿成大事故。干网路维护进行故障处理,是比较有含金量的工作,也正是这样,网络故障排查专家非常受人欢迎。想要成为一名资深的网络维护专家,需要在故障分析和诊断上有手段。大多数的网络维护人员都是通过查设备、查线路、抓包、找故障点,累得烦死、掉大把头发还不能解决各种网络故障问题,这是因为没有找到这其中的门道。做网络维护要做网路设备监测、网络设备定位和故障定位报警、网络流量分析三点,这里称为三把斧。用好这三把斧头可以在网络技术世界里披荆斩棘,所向无敌。

第一把斧:网络流量分析

数据中心网络并不关心应用层的内容,只完成数据流量的交互,这样对流量的走向分析尤为重要。要对整个数据中心网络里所有链路流量进行监测,当故障发生时,能够迅速锁定故障范围和位置,这些故障最早在流量图上就可以反映出来,所以流量分析软件,对于数据中心网络维护必不可少。选择一两款使用广泛的流量分析软件部署到数据中心网络中,灵活启动不同层面(接入层、汇聚层、核心层)的网络设备进行流量信息采集,不需要改动现有的网络结构,实现对数据中心网络流量信息统计和分析功能,能够及时了解各种网络应用占用的网络带宽,各种业务消耗的网络资源,可以帮助网络维护人员及时发现网络瓶颈,防范网络病毒的攻击,并提供丰富的网络流量分析报表。学会从网络流量图中发现问题并解决问题,是网络维护的基本技能,必须要掌握。

第二把斧:网络监测分析

数据中心网络只要确保流量送达目的设备,就完成了自己的使命,这个运送过程是否有问题,需要通过监测手段来确定。一般我们判断一个网络是否有问题,往往需要借用一些探测工具,比如:PING、TRACERT、SNMP、SYSLOG等工具。通过PING和TRACERT可以快速确认故障位置和设备,以便对故障设备进行深入分析。通过SNMP和SYSLOG可以获取到故障设备运行的基本信息,很多时候通过设备报出的SYSLOG信息就可以确认设备故障的原因。很多数据中心将这些工具都固化到网络监测软件中,这样可以有效地预防或发现故障,警报将通过声音、短信、微信等方式显示报警框、发送Mail等方式及时发送相关人员,或自动运行相应的程序进行故障处理,提供全方位的告警监测、统计分析和报警定位。

第三把斧:网络故障分析

当用了前两把斧,故障分析依然没有头绪,就需要用上这第三把斧,对故障进行深入分析。这时还是要借助于从以上两点获得的网络基本情况,对故障表现有了基本了解。网络故障表现反映到PING业务上无非三个现象:不通、丢包、延迟大。三个现象衍生出来各种各样的网络问题,根据三个故障现象接着分析。首先,不通那一定是转发表项或者数据通路上出了问题,要沿路检查二三层转发表项、端口、VLAN、链路这些设备信息,看是否有设置错误的地方,再有就是不通也可能是连接设备直连的链路出现了断路,这个不仅指设备外部之间连接的链路、模块,也包括设备内部的连接,有的框式设备内部流量要经过很多块板卡,内部互连出了问题也会影响到转发,有的盒式设备,流量进入设备后,还没有处理就在端口的连接器上将报文丢弃掉了,这些都会造成不通;其次,丢包一定是转发表项不稳定或者数据通路上不稳定造成的问题,还是要将转发表项和数据通路都检查一遍,但是更加关注的是转发表项的稳定性,是否有变化,数据通路上更加关注是否有错包、MAC地址迁移、STP切换等故障表现;第三,延迟大那一定是数据通路上出现了拥塞,数据流量超过了网络通路上能提供的最大带宽,这时要沿路查转发通道,看是否有拥塞丢包,端口流量是否有超线速、限速情况,这些故障会导致业务层面延迟大,延迟大对应用业务伤害蛮大的,访问体验感超级差,尤其是视频业务,会导致画面不流畅,观赏性变差。

做数据中心网络维护要用好这三把斧。这三把斧头说起来简单,可用起来就有很多门道,不同的人对此都有不同的理解,表现出来的就是每个人的网络技术水平。真正对这三把斧都理解透彻,往往需要大量时间经验积累。将每一把斧头展开谈的话,都会涉及到很多的网络技术,这需要在网络维护工作中不断地消化理解,慢慢地认识到,掌握了这三把斧,就可成为数据中心网络维护的专家。

责任编辑:赵宁宁 来源: 企业网D1Net
相关推荐

2020-03-04 10:48:22

数据中心维护外包网络

2023-09-21 17:28:38

数据中心

2018-07-18 10:07:51

数据中心机房维护

2011-10-12 16:28:33

数据中心制冷CRAC

2015-10-08 14:08:08

2019-11-25 11:02:43

数据中心IT技术

2018-10-31 14:32:53

数据中心网络架构

2012-11-23 09:37:35

数据中心

2017-07-13 09:26:28

数据中心运营优化

2024-05-06 11:29:26

数据中心电力维护

2023-04-07 10:16:12

数据中心网络边缘

2016-01-25 09:45:49

数据中心网络技术

2012-05-02 10:06:34

虚拟桌面基础架构VDI数据中心

2015-11-12 10:09:47

2014-02-14 09:28:55

数据中心日常维护

2012-03-01 10:39:46

数据中心空调维护

2014-09-09 17:36:21

数据中心网络

2009-12-31 16:22:57

数据中心之“变” 网络

2011-04-12 10:54:30

网络布局机房布线

2017-09-28 10:49:24

数据中心网络重构
点赞
收藏

51CTO技术栈公众号