SDN应用路由算法实现工具之Networkx-51CTO.COM

SDN(Software Defined Networking)是一种新型的网络架构，通过集中式的控制平面管理数据层面的转发等操作。网络的连通性是最基础的需求，为保证网络连通，控制器需应用相应的图论算法，计算出转发路径，完成数据转发。在开发SDN应用时，为完成基础的路径计算，时常需要开发者独立编写网络算法，不仅麻烦，性能和代码可复用性还受开发者个人编程水平影响。所以本篇文章将介绍网络算法工具networkx，用于完成路径算法的开发工作。

networkx是用于创建、操作和研究复杂网络动态、结构和功能的Python语言包。networkx支持创建简单无向图、有向图和多重图(multigraph);内置许多标准的图论算法，节点可为任意数据，如图像文件;支持任意的边值维度，功能丰富，简单易用。

由于Networkx代码经过多次测试，性能方面也做了很多的工作，使用Networkx内置的多种图论算法能给开发SDN应用带来很多的便利，可以节省开发时间，降低代码故障率。networkx的安装和使用，读者可从官网文档中快速得到，不加赘述。接下来的内容将简要介绍Networkx的经典图论算法内容，包括最短路径, KSP(K Shortest Paths)算法和Traversal(遍历)算法BFS(Breadth First Search)/DFS(Depth First Search)。

最短路径算法Dijkstra和Floyd

计算单源到其他所有节点的最短路径的Dijkstra算法和计算所有节点之间最短路径的Floyd算法是最经典的网络算法之一。在networkx中对于二者的实现将在如下介绍。

Dijkstra

无论有向图还是无向图均可以使用Dijkstra算法，G为networkx生成的图数据结构。source为起点，target为终点。起点、终点和权重均为可选参数。

networkx.shortest_path(G, source=None, target=None, weight=None)

无权图

networkx.single_source_shortest_path(G, source[, cutoff])

有权图

networkx.dijkstra_path(G, source, target, weight='weight')

Floyd

对于Floyd算法，有无权图和有权图两种实现：

无权图

networkx.all_pairs_shortest_path(G[, cutoff])

有权图

networkx.all_pairs_dijkstra_path(G[, cutoff, weight])

对于路径的长度计算可以调用network.XXX_length函数获得，XXX为对应的路径计算算法名称。除了以上提到的几个算法以外，networkx还针对很多需求设计了变种的函数，如返回同样长度的多条***路径算法等，读者可根据需求自定义学习内容。

K-Shortest paths

在研究网络路由算法/转发算法时，除了使用跳数作为计算***路径的标准以外，还会使用到很多其他的指标，如带宽、时延等，也有可能根据多种指标，建立多维度评价系统，计算加权值，从而计算***路径。例如，当涉及到带宽为标准时，计算量就会很大。首先，获取网络链路的剩余带宽数据，然后从源头开始，选途径路径中带宽***的路径。由于一条链路中的***剩余带宽取决与剩余带宽最小的那一条，若使用贪心算法逐跳排除，很可能计算错误，所以每遇到一个分支就需要选择一个路径，并保存其他未选择的路径数据。每一个节点都需要对所有的数据进行对比，从而选择当下***的路径，直至所有的链路都比较完成。这样的算法可以通过修改Dijkstra算法完成，逻辑不困难，但效率并不高，具体实现不加赘述，读者可查看笔者在网上找到的一个介绍文章:基于SDN的最短路径算法(迪杰斯特拉)dijkstra。

在研究的过程中，发现许多论文提到的方法都是基于拓扑信息算法K条最短路径，然后在根据带宽计算***路径。根据算法可以直接在这K条中选择***的路径最为***，也可以设置权重，计算跳数和带宽的加权值，再选择***。由于跳数的数值和带宽的数值相差甚远，所以二者均需进行归一化/正则化。

考虑跳数的原因在于：每经过一个交换机，消耗的资源就多一份，所以需要考虑在内。举例：路径A带宽100M，跳数为2; 路径B带宽110M，跳数为5,若按照带宽选择则选择B，然而B经过的路径是A的若干倍，消耗的资源更多，产生的传输时延，以及传播时延(假设跳数为5的链路长度大于2，否则不成立)也更多，所以综合考虑A可能是更好的路径。

传统的KSP算法很多，Yen, Jin Y于1971年发表的论文 "Finding the k Shortest Loopless Paths in a Network"中提出的Yen's algorithm就是经典算法之一，读者可直接查看点击Yen's algorithm的wiki。其算法思想并不复杂，基本思想为：

Dijkstra选择第1条***路径，保存为A[0]

外循环，k从1到k。内循环，以第k-1条(前一条)***路径为路径，从该路径的***个点开始作为分叉节点，分叉节点之前的为前一条***路径与当前路径一致的部分，称之为rootpaths;将分叉点上已选的***路径分支去掉(权值设置为正无穷)，然后再运算dijkstra,将路径计算结果放到临时数据结构B中，随着循环的进行，分叉点不断前进，直至终点前一跳，内循环比较，已选出多条潜在的***路径。

对临时数据结构B中的路径进行排序，找到***路径，添加到A数据结构中，存为A[k], 外循环一轮结束。

外循环继续，直至找到K条***路径。

Networkx已经实现了KSP算法，该算法patch于2015年4月份左右才加入networkx项目，由于networkx中all\_shrtest\_paths名字已被使用，所以新加入的算法在networkx中对应函数命名为all_simple_pay，具体参数如下所示：

all_simple_paths(G, source, target, cutoff=None)

其中G为networkx的图数据结构，source为起点，target为终点，cutoff为搜索深度，只返回路径长度短于cutoff的路径。为优化性能，函数返回值为一个generator(生成器)，读者可通过for循环，生成对应的K shortest paths。采用generator可以逐次计算结果，而不会一次运算全部结果都写入内存，可以大大降低内存使用。

Traversal

在某些网络应用场景中，会使用到遍历算法，如BFS(Breadth First Search)/DFS(Depth First Search)算法， networkx已经定义好的对应函数，具体内容由于篇幅限制，不再介绍。读者可查看networkx官方文档中关于遍历的文档进行学习。

总结

在开发SDN应用中，网络连通性是最基本的需求。在开发网络应用时，可采用networkx来保存网络数据，计算路径等，大大提高了开发效率。在学习的过程中，从自己不断造轮子，到逐渐使用成熟的开源软件，接触了很多工具，学习到了很多有用的知识。自己造的轮子很多时候，性能、适用度以及接口的稳定度都是很大的考验，逐渐尝试优秀的开源工具将成为我在未来编程学习的方向。