网络监控可以采用多种形式,具体取决于需要监控的内容。随着网络架构变得更加以软件为中心和去中心化-从混合云和多云的角度来看,网络团队可能会发现难以理解各种类型的网络监控方法和工具。
下面让我们看一下四种网络监控类型,以及特定的机制和协议,它们可提供企业所需的适当级别的可见性。
可用性监控
可用性监控是网络团队了解设备是否正常运行的最简单方法。有些可用性监控工具不只是监控设备是完全在线还是离线。特定的接口状态通知和网络设备硬件检查通常属于这一类。
监控网络可用性的常用协议示例包括:
- Internet控制消息协议(ICMP)。ICMP ping是一种简单的验证测试,用于显示设备是否可在网络访问。
- 简单网络管理协议(SNMP)。SNMP监控设备和接口状态。
- 事件日志(syslog)。当上行链路、接口或路由变得不可用时,Syslog收集服务器可以触发警报。
配置监控
对于管理使用本地配置文件的传统网络组件的人来说,配置监控检查非常重要。从性能和IT安全的角度来看,自动化工具必不可少,这些工具可以比较相似配置的设备是否存在不准确性。
这些工具通常采用设备配置文件的命令行输出,并将其与网络上执行类似任务的其他文件进行比较。网络团队可以调查配置之间的差异,以确保所有网络组件都设置为相同的操作。
配置监控的主要功能包括:
- 实时监控网络配置更改以及谁做出的更改;
- 发生未经授权更改时,自动回滚配置;
- 网络设备之间的配置比较,以发现配置错误。
性能监控
虽然网络可用性监控与性能监控有些重叠,但两者之间存在明显差异。
可用性监控更关注构成网络基础设施的组件的运行状态,性能监控也是如此,但更加强调最终用户的性能体验。因此,性能监控更侧重于网络利用率、延迟和次优路径选择。
性能监控协议的示例包括:
- SNMP。这会在接口、交换机CPU和内存过度使用时发送警报。
- 事件日志(系统日志)。当利用率达到特定阈值或发生意外的路由更改时,系统日志会触发警报。
- 基于流的监控。这提供了对特定网络流对话和每个流消耗的带宽量的可视性。
- 数据包捕获分析。这提供对网络对话的深度分析,这些对话通常会显示底层传输问题,这是上层监控工具无法识别的。
- 流式遥测。这是对实时网络运行状况和性能数据的收集和分析,用于快速识别和解决复杂问题。
云基础设施监控
在很多情况下,对于私有云和公共云实例,企业可以部署在企业网络相同类型的网络监控工具。但是,很多云服务提供商提供自己的内置网络监控工具套件。虽然这些云监控工具通常免费,但这些工具通常无法集成到企业正在使用的其他第三方工具中。
企业必须权衡利弊,考虑管理多个分布式网络监控服务,还是花费更多时间和精力将监控集中到少数工具。部署这些工具的要求可能更高,但它们有助于提供企业网络和云端的全面可见性。
现代网络监控的改进
网络监控方面的几项显着进步可帮助减轻ITOps员工的管理和支持负担。例如,很多网络架构可完全通过集中式云门户进行配置和管理。在很多情况下,中央控制平面预先构建了无数网络监控工具和警报功能,这意味着不再需要单独的第三方工具。
受COVID-19疫情影响,广受欢迎的其他改进是硬件或软件代理,可用于监控在家办公员工和微型分支机构的网络性能。这些硬件以及基于软件的工具使ITOps员工能够监控远程用户的网络性能,无论他们在哪里工作。
最后,在网络监控工具中使用AI和机器学习有助于消除很多手动流程,并加快识别和修复网络相关问题的速度。无论是性能还是安全相关,事实证明,人工智能在发现问题、确定根本原因以及在某些情况下自动修复网络事件方面具有重要价值。