每个网络应用程序都有自己的一组功能和性能参数,这些功能和参数可能会动态变化。由于网络的多样性和复杂性,围绕此类网络场景构建的传统算法或硬编码技术是一项具有挑战性的任务。
事实证明,机器学习在几乎所有行业都是有益的,包括网络行业。机器学习可以帮助解决棘手的旧网络障碍,刺激新的网络应用程序,使网络变得非常方便。让我们通过几个用例详细讨论基本工作流程,以便更好地理解网络领域中的应用机器学习技术。
智能网络流量管理:
随着对物联网解决方案需求的不断增长,现代网络产生了大量异构的流量数据。对于这样一个动态网络,传统的网络流量监控和数据分析网络管理技术(如Ping监控、日志文件监控,甚至SNMP)是不够的。它们通常缺乏实时数据的准确性和有效处理。另一方面,由于设备移动性和网络异构性,网络中来自其他来源(如蜂窝或移动设备)的流量相对显示出更复杂的行为。
机器学习有助于在大数据系统和大区域网络中进行分析,以便在管理此类网络时识别复杂模式。鉴于这些机会,网络领域的研究人员将深度学习模型用于网络流量监控和分析应用,如流量分类和预测、拥塞控制等。
1.带内网络遥测
网络遥测数据提供了有关网络性能的基本指标。这些信息通常很难解释出来。考虑到网络中的数据量和总数据量具有巨大的价值。如果使用得当,它可以显著提高性能。
新兴技术,如带内网络遥测,可以帮助实时收集详细的网络遥测数据。最重要的是,在这些数据集上运行机器学习可以帮助关联延迟、路径、交换机、路由器、事件等之间的现象,这在使用传统方法的大量实时数据中很难指出。
机器学习模型经过训练以理解遥测数据中的相关性和模式,从而最终获得基于历史数据的学习预测未来的能力。这有助于管理未来的网络中断。
2.资源分配与拥塞控制
每个网络基础设施都有预定义的可用总吞吐量。它被进一步分割成不同预定义带宽的多个通道。在这样的场景中,每个最终用户的总带宽使用量是静态预定义的,对于网络的某个部分来说,总是会出现瓶颈,而该部分网络的使用率是压倒性的。
为了避免这种拥塞,可以训练有监督的机器学习模型来实时分析网络流量,并以网络经历最少瓶颈的方式推断每个用户的合适带宽限制。
这些模型可以从网络统计数据中学习,例如每个网络节点的总活动用户、每个用户的历史网络使用数据、基于时间的数据使用模式、用户在多个接入点之间的移动等。
3.交通分类
在每个网络中,都存在各种各样的流量,如Web托管(HTTP)、文件传输(FTP)、安全浏览(HTTPS)、HTTP实时视频流(HLS)、终端服务(SSH)等。现在,当涉及到网络带宽使用时,每一种行为都有所不同,即通过FTP传输文件。它连续使用大量数据。
例如,如果一个视频正在流化,它将使用数据块和缓冲方法。当不同类型的流量以无监督的方式在网络中运行时,可以看到一些临时阻塞。
为了避免这种情况,可以使用机器学习分类器对网络中的流量类型进行分析和分类。然后,这些模型可用于推断网络参数,如分配的带宽、数据上限等,以通过改进所服务请求的调度以及动态更改分配的带宽来帮助提高网络性能。
网络安全:
网络攻击数量的增加迫使组织不断监控和关联整个网络基础设施及其用户的数百万外部和内部数据点。手动管理大量实时数据变得很困难。这就是机器学习帮助的地方。
机器学习可以识别网络中的某些模式和异常,并在海量数据集中预测威胁,所有这些都是实时的。通过自动化分析,网络管理员可以轻松地检测到威胁并快速隔离情况,而所需的人力更少。
1.网络攻击识别/预防
网络行为是机器学习系统异常检测的一个重要参数。机器学习引擎实时处理大量数据,以识别威胁、未知恶意软件和违反策略的行为。
如果发现网络行为在预定义的行为范围内,则接受网络事务,否则将在系统中触发警报。这可用于防止DoS、DDoS和Probe等多种攻击。
2.防止网络钓鱼
诱骗某人点击看似合法的恶意链接,然后试图突破计算机的防御系统是很容易的。机器学习有助于预测可疑网站,帮助防止人们连接到恶意网站。例如,文本分类器机器学习模型可以读取和理解URL,并首先识别那些伪造的钓鱼URL。这将为最终用户创造更安全的浏览体验。
网络中机器学习的集成不限于上述用例。通过从网络和机器学习的角度揭示机会和研究,可以在使用ML进行网络和网络安全的领域开发解决方案,以解决尚未解决的问题。