一个网络性能的好坏,直接影响到用户的体验和网络的标准。那么在这方面我们如何进行网络监控呢?这个问题并不容易回答。所以,我们分为几个小问题来为大家详细解答。
为什么需要网络性能基线呢?
简而言之,一个网络性能基线是网络性能监控中用来定义企业网络基础架构正常工作条件的一个衡量标准。工程师可以使用网络性能基线进行比较,从而发现可能导致问题的流量变化。
设置一个网络基线也能实现一个早期指示器,这样应用和网络需求的实现就会接近于有效容量,从而使网络团队有可能进行升级规划。使网络性能基线与现有的网络服务级别协议(SLA)对齐可以帮助IT组织保持容量参数和确定违反规范的问题范围。
然而,对于工程师来说网络监控的挑战是定义他们组织基础架构正常的条件。
没有网络监控或测试的行业标准
对于采用Information Technology Infrastructure Library (ITIL)框架作为最佳实践方法的IT组织来说,他们可以使用一些ITIL特有的监控工具。这些工具的设计利用支持IT服务管理过程的设备配置数据库和应用程序。然而,除了ITIL之外,还没有一种设置性能基线的行业标准方法。支持监控工具和生成具有广度和宽度的信息会由于制造商、设备和操作系统的不同而明显不同,从而最终妨碍在监控中使用一组通用的测试基准。
对于解决这个问题,最好首先是从网络供应商本身着手。至少,每一个供应商都有一系列支持特定设备的监视器。考虑到诸如SNMP等监控协议的普遍存在,许多供应商也有他们自己可用于监控和定义他们的产品临界值的推荐方法或最佳实践。拥有了这些信息,管理员就可以首先关注于一个小范围的可用监视器并在需求时进行扩展。例如,Cisco推荐它的路由器的CPU负载不应该超过60%,并且已经发布了一个监控这个统计的SNMP消息。
网络性能监控:评估状况和考虑虚拟化技术
在创建网络监控设备清单时,一定要在清单中同时包含物理和虚拟设备。对于当前流行的设备和服务器虚拟化、虚拟交换机(vSwitch)和虚拟化应用加速器在检查网络性能时是很重要的考虑方面。vSwitch使虚拟机之间能够在不需要通过物理网络适配器的前提下实现通信。虽然vSwitch能加速内部服务器通信,但是它们无法使网络监控工具实现对这些路径的报告或对应用性能数据进行接受。幸好,网络行业已经认识到了这个问题,并且正在改善这个状况。
收集数据来设置一个网络性能基线
在确定网络设备清单后,下一步是分析基础架构中传输的流量。虽然网络的总体利用情况是网络总体健康的一个合理的指示器,但是这一测量基准还不是用户在网络中实际操作的全部环境。要了解网络是如何使用的,这些监控工具必须收集和打开实际的数据包。
收集网络数据进行流量分析的方法有两种,每种方法都各有利弊。数据捕捉或嗅探工具能够捕捉整个网络数据流,这样管理员便能及时获得在一个特定时刻关于网络状况的完整视图。嗅探网络能够完全了解网络运行状况。虽然这对于网络故障分析和修复非常重要,但它可能会严重影响持续的网络监控和基线分析。对于网络性能监控,应用程序和网络使用率的测量是非常重要的,但不一定要包含每个数据包中的信息。在这些情况中,网络嗅探工具能够提供所需要的信息,但是这可能会引起严重的过载。
提供sFlow/NetFlow监控示例数据
除此之外,诸如NetFlow或sFlow等协议在设计上通过指定的间隔进行流量捕捉而更节约存储。NetFlow及其衍生软件是内置在许多企业路由器中的,它们将示例数据传递给监视器而不引起嗅探器过载,从而获得关于网络中运行的应用程序的合理概况。通过执行数据包分析,管理员可以看到应用使用的趋势同时根据整个网络使用分配每个应用的使用比率。
更进一步地,大多数工具也能够帮助解析Internet流量,例如,将使用基于云技术的应用流量与常见Web浏览的流量。了解每一个应用程序使用了多少网络资源不仅能够确定响应时间的问题根源,也使管理员能够看到新应用程序和服务在部署到网络时产生的影响。
设置一个网络性能基线必须监视多长时间?
在准备好所有需要的监视器后,下一步是使这些监视器运行并创建数据点。许多专家认为一个有效的监控窗口发现性能趋势需要一周时间。
考虑捕捉流量的环境是很重要的。大多数组织使用的是周期使用模式,而所有流量分析员都应该了解这些模式。例如,一个大型零售商一定会在假期中遇到网络和应用程序高峰。而一个制造商实际上则可能看到相反的效果,因为在相同的假期中工厂停工会显著降低网络的使用。如果分析人员不能说明这些业务周期,那么网络性能基线结果可能在这两种情况中会大相径庭。
这些数字中的任何明显高或低的数值都必需确定出来,并且要确定它们发生的原因和它们实际是否为网络基准的一部分。如果您偶然发现由已知问题产生的峰值,那么就要在其余的数据点上创建基线。如果这个峰值被确定为一般情况,那么就要将它们计算在测量平均值中。很可能在您的监控周期中网络出现了一个重大的问题。在这种情况下,更安全的做法是先处理这些数据点,然后在问题消除后再进行测量。
当收集到一定量的监控数据并说明了一些根本的变化后,我们就可以为每一个测量分配一个基线。最终结果是为您定义的每个监视器确定一般范围的值。这些范围一起就构成了当前的网络性能基线。
最后一点要考虑的是您现在所设定的网络性能基线只在网络发生变化之前有效。网络设备升级、新服务器和新应用程序都将会影响现在的基线,也将要求以持续的方式考虑和提供监控解决方案。然而,好消息是在大多数情况下,不是所有事情都会马上发生变化的,所以在添加或删除一些应用、服务或设备时只需要做少量的修改。