网络故障的概述如下:
1.网络复杂性的原因
当今的网络互联环境是复杂的,而且其复杂性还在日益增长.主要原因如下:
现代的因特网要求支持更广泛的应用,包括数据、语音、视频及它们的集成传输;新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;提供QoS能力等。新技术的应用同时还要兼顾传统的技术。例如,传统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。
2.网络故障及故障管理
网络故障就是网络不能提供服务,局部的或全局的网络功能不能实现。用户感知的只是应用层的服务不能实现,但应用层的服务要依赖它下面几层的正确配置和连接;不仅仅是依靠服务器,同样也需要客户端的正确配置。故障(失效)管理(fault management)是网络管理中最基本的功能之一。用户都希望有一个可靠的计算机网络。当网络中某个组成失效时,网络管理系统必须迅速找到故障,及时排除。
分析网络故障原因是网络故障管理的核心内容。对故障的处理包括故障检测、故障定位、故障隔离、重新配置、修复或替换失效的部分,使系统恢复正常状态。
故障管理具有如下功能。
1)故障警告功能:由管理对象主动向管理主机报告出现的异常情况,叫故障警告,其必须包含足够多的信息,详细说明出现异常的地点、原因、特征,以及可能采取的应对措施等。
2)事件报告管理功能:事件报告管理功能目的是对管理对象发出的通知进行先期的过滤处理,并加以控制,以决定通知是否应该改善给其它有关管理系统,是否需要改善给后备系统以及控制改善的频率等。有两个管理对象,一个是区分器,主要作用是对管理对象发出的通知进行测试和过滤;另一个是事件转发区分器,主要用于确定转发的目标。
3)运行日志控制功能:管理对象发出的通知和事件报告应该存储在运行日志中,供以后分析使用。定义了两个管理对象类:运行日志和日志记录。 管理对象发出的通知通过本地处理形成日志记录,日志记录存储在本地运行日志文件中。
4)测试管理功能:管理主机有一个叫做测试指挥员的应用进程,而代理有一个叫做测试执行者的应用进程。指挥员可以向执行者发出命令,要求进行某种测试,执行者根据指挥员的命令完成测试。测试结果可以立刻返回给指挥员,也可以作为事件报告存储在运行日志中,待以后分析用。
5)确认和诊断测试的分类:确认和诊断测试可分为连接测试、可连接测试、数据完整测试、端连接测试、协议完整性测试;资源界限测试、资源自测;测试基础设施的测试。用故障标签对故障的整个生命周期进行跟踪。所谓故障标签就是一个监视网络问题的前端进程,它对每一个可能形成故障的网络问题,甚至偶然事件都赋予唯一的编号,自始至终对其进行监视,并且在必要时调用有关的系统管理功能以解决问题。
3.网络故障管理的一般思路
首先,网络故障管理首先能够自动发现、生成和维护网络拓扑结构,形成网络模型。该模型应该与管理员头脑中的网络图像一致。通过核对该图,管理员可以纠正错误认识,或者发现用户私自增加和改变的网络连接。一般网管软件可以生成基于IP网络的拓扑结构图,高级网管软件则可以生成和维护基于交换机的物理连接的拓扑结构图。
然后,故障管理以此模型为基础自动定期轮询网络设备,监视线路设备的运行状况和故障情况。故障管理的核心是对采集到的故障信息的处理。网管软件可以理解网络拓扑结构和故障来源、严重性,自动、及时、直观地在网络拓扑界面表示该故障。这对实时监视和解决问题非常有效。界面的直观易用性是考察此类软件的侧重点。
4.故障管理对于网络管理员的知识要求
当网络遭遇故障时,最困难的不是修复网络故障本身,而是如何迅速地查出故障所在,并确定发生的原因。网络故障的现象有很多,即使同一个故障的表面现象也可能不一样,所以作为一名网管员,要善于抓住问题的本质,用最快的速度去排除故障。
5.网络故障的分类
根据网络故障的性质分为物理故障与逻辑故障。
根据网络故障的对象分为线路故障、路由故障和主机故障。
根据网络故障的程度分为连通性问题和性能问题。
连通性问题包括:硬件、媒介、电源故障;软件配置错误和兼容性问题。
性能问题包括:网络拥塞、到目的地不是***路由、供电不足、路由环路、网络错误。
【编辑推荐】