三个“不可视”
由于IP网络运维存在三个“不可视”,存在黑匣子现象,导致运维效率低。
首先,承载的业务品质不可视,不能感知终端用户体验。
传统网管只能提供网络的性能,看不到内容的承载质量,网络性能与业务品质是分离的,业务部门和网络部门认识故障的维度不统一,没有统一的度量尺度,造成故障定位需要跨部门专家协同工作,人员技能要求高,故障定位效率低,互相推诿责任的现象时有发生。
其次,路由不可视,看不到业务路径。
IP网络引入动态路由,三层网络是一片云,看不到业务的路径。路由不可视导致在IP网络运维过程中,经常出现终端用户申报了故障,而当运维人员进行故障定位时,故障又消失了,故障无法重现,又没有历史信息可以查询,无法找到故障原因,无法彻底解决用户的问题,造成排除故障隐患困难,并且需要高水平的数通专家参与故障定位。路由不可视还导致运维人员无法预防路由振荡引起的全网故障,路由振荡对网络的影响是灾难性的,最坏可以引起网络瘫痪。
第三,端到端管道不可视,创建过程复杂,且状态不可视。
端到端管道的创建过程需要跨域部署,并且配置内容复杂,传统的单域网管不能实现可视化的高效下发,下发后也不能看到IP管道的状态。在业务部署过程中,需要运维人员全盘考虑每个节点上业务部署的参数和参数之间的相互关系,一旦发生参数配置错误,也很难检查和纠正,对IP运维人员的专业技能要求高。
面对上述难题,运营商的网络运维部门往往很是头疼。难道IP网络的可靠性真的很低吗?
探索解决方法
其实,IP网络的可靠性并不是无法解决。在IP网络运维中,我们需要一个很重要的思想转变,即从被动运维转为主动运维。
相比以前接到终端用户投诉再进行网络故障检测的被动运维模式,IP网络的运维要求更高,需要运营商根据网络的日常运行状况提前预警网络的薄弱环节,提前预防。因此,运维模式的转变在All IP化道路上显得非常重要,那么到底什么样的主动运维才符合IP网络呢?
主动运维要求实现对终端用户的业务体验监控,运维人员周期性地收集网络性能和业务品质数据,并通过分析数据,将其中的趋势内容挖掘出来,对潜在的故障点和薄弱环节进行预判断,使运营商可以提前感知终端用户的业务体验程度,预先判断业务是否会发生劣化,并提前解决由此带来的一系列问题,从而降低终端用户投诉,提高客户忠诚度,并降低运维成本。
运营商在运维系统的投资驱动力的分布情况,验证了IP主动运维的必要性。Gartner的调查结果表明,“主动预防网络性能问题”是当前运营商首要的运维投资驱动力,占整个投资的27%,而“快速网络故障诊断”、“业务质量保障SLA”分别排在第二、第三位,其投资驱动力分别为15%、12%。
IP网络运维有以下三个要求:快速解决故障,即当网络和业务出现故障时,需要快速解决问题,实现迅速的故障定界和定位;主动预防问题,即对业务质量和网络性能实时监控,及时发现问题,IP承载网的故障需要关联到被影响的业务上,并通过趋势分析,提前做出预警;网络日常管理,即建立网络质量监控和健康评估系统,通过整套的KQI/KPI指标体系来反映和管理用户体验,掌握网络的实际运行状态,不断提高终端用户的忠诚度。
可度量,才可管理;可管理,才可改进。在网络IP化后,最先需要解决的问题就是可度量,即IP运维要做到可视。
IP网络的“仪表盘”
IP网络的管理方法是多种多样的,但只有充分跟业务关联,关注QoE指标,真正实现IP网络运维的可视化,才能保证网络的可靠性,才能更好承载各种业务。华为开创IP网络可视化的业界先河,成功实现IP业务质量、路径和部署的可视化,彻底解决IP运维的黑匣子问题。
U2520是华为公司最新推出的IP网络业务保障系统,支持宽带承载、移动承载、IP Core解决方案,由业务监控系统和网络评估单元两部分组成。
业务监控系统可以实现网络质量监控、业务质量监控、按需测试、阈值告警管理、探针管理、系统管理和报表管理功能。网络评估单元是盒式外置探针,可以部署在网络接入层和汇聚层,实现对网络和业务性能数据的采集并上报给监控系统。
华为U2520被誉为IP网络的“仪表盘”,其技术优势体现在以下两个方面:
IP转发平面可视:感知IP承载业务品质,全面监控IPTV、VoIP、HSI、VPN业务,真实反映终端用户的业务体验,通过业务承载质量的逐段对比,实现基于业务的故障的定界和责任划分,便于维护人员对IP转发平面的故障进行快速处理。IP网络运维部门和业务运营部门拥有相同的QoE指标,业务故障的界定一目了然。
IP控制平面可视:IP业务有了路径,自动计算并显示业务路径,监听和分析路由变化,预防路由振荡引起的全网故障,用于维护人员对IP控制平面的故障进行快速分析、预警和定位。
IP转发平面可视和IP控制平面可视相结合,转发平面主动模拟业务报文测试过程,可以结合业务路径进行测试。一旦三层业务路径发生变化,转发平面的测试也动态调整,转发平面的测试也就可以实现对业务承载的自动化监控管理;一旦发现业务承载质量有劣化趋势,即可自动触发智能专家诊断系统,在短时间内发现劣化的根因,并通过专家诊断系统给出问题处理建议,将IP网络运维效率大幅提升,并可以像SDH网络运维一样实现主动运维,通过运维效率的改进,提升网络竞争力,并有效提高终端用户的满意度。
在全面监控IP转发平面和控制平面的基础上,华为U2520提供完善的指标体系,提供网络健康评估系统,并提供运维工作的评判标准,提高网络运维能力。通过指标体系的分析统计,基层运维人员能够在解决眼前问题的同时,发现问题产生的根源,并针对性地加以改进,以规避人为因素导致的一些故障,从而实现运维效率的持续改进提升。
U2520还能实现业务监控全网化,提供多厂商设备组网的业务品质监控解决方案,满足运营商各种组网环境的监控要求。
值得一提的是,与U2520共同使用的华为U2000网管系统,支持E2E业务参数的资源池管理,通过点击源、宿节点即可完成E2E业务的自动创建,系统动态分配业务参数,自动管理各网元上E2E业务参数之间的逻辑关系,自动检查配置,自动校验通断,一次开通业务,并支持一站式多网元批量配置,端到端业务发放VPN,端到端可视操作,管道质量可视化展现,易学易用。
自2009年第三季度正式推向市场后,U2000在全球的应用进入了一个快速增长期,截至目前,已在欧洲、北美、亚太、澳洲等地区的30多个主流运营商实现了规模部署,其中包括中国移动、中国联通、Vodafone、DT、FT、Telefonica、Swisscom等全球领先运营商。