网络世界因为思维模式的广泛变化而闻名,并通常驱动着网络行业的炒作周期。其中有很多模式转变,例如集中控制平台、分散控制平台,以及各种路由协议和范例。
目前正在发生的一个主要变化是支持公共云或私有云的叶脊数据中心结构,可以将其视为将网络、计算和存储资源作为计算能力单元进行的销售。
数据中心结构通常基于最初为电话网络设计的CLOS结构,其中准入控制是服务质量的主要手段。在电路交换领域,网络性能指标主要是分配固定数量的带宽,如果没有可用带宽,则拒绝允许连接。
这些最初的LOS网络已经通过折叠(或双向传递流量)和构建不同的变体(如Benes和Butter)来适应计算机网络。这些更通用的叶脊网络对网络性能指标提出了超出导纳控制的挑战。
以下是网络面临的一些挑战。
例如在一个网络中,主机1和主机2之间有256条路径。那么可以收集哪种网络性能指标来了解网络的运行情况?
收集每个接口的队列深度、丢弃数量和传输控制协议重传将提供网络性能的可靠通用视图。但是,除了这个抽象视图之外,很难看到如何收集有助于任何一个应用程序更高效地操作的信息。
这是一个更具体的示例:如果应用程序性能不佳,并且怀疑问题出在网络中,那么将在哪里开始故障排除?很难通过这些类型的宽泛等价多路径网络跟踪任何数据包或数据包流的路径,以确定可能存在问题的位置。
一个可能的答案是向网络添加更多状态,尤其是在网络性能指标中。例如,如果使用IPv6版本的分段路由(SRv6),则可以为网络接受的每个数据包添加一个报头,并在数据包报头上添加路径列表。
由于SRv6在交换过程中不会删除或修改此标头,因此检查路径中任何一点的数据包报头将显示数据包已通过网络的路径。有许多不同的方法,可以通过网络添加跟踪单个流所需的信息类型,但每种方法还涉及另一种权衡。
添加这些网络性能指标可能会产生大量新信息,网络管理系统必须消耗、管理、分类和考虑。在对问题进行故障排除、容量规划以及通常了解网络健康状况的过程中,人们也必须消耗这些信息洪流。这些问题尚未得到完全解决,但它们可能是研究、机器学习以及网络管理系统设计和部署中更强大架构方法的新方向。