如何使用图算法,帮助我们理解和处理复杂的关系型数据

开发 后端
图算法是用于解决图(Graph)数据结构中的各种问题的算法,对广度优先和深度优先做了一些示例,还有注释,我们可以私下练习一下。

算法是编码面试中最常见的主题之一。为了在面试中获得优势,非常熟悉顶级算法及其实现非常重要。

在次此篇文章中,我们将探索图算法。我们将从图论和图算法的介绍开始。接下来,我们将学习如何实现图。

今天,我们将学习:

  • 什么是图算法?
  • 图的属性
  • 如何在代码中表示图形
  • 如何实现广度优先遍历
  • 如何实现深度优先遍历
  • 如何去除边缘

什么是图算法?

算法是使用明确定义或最佳步骤数解决问题的数学过程。它只是用于完成特定工作的基本技术。

图是一种抽象符号,用于表示所有对象对之间的连接。图是广泛使用的数学结构,由两个基本组成部分可视化:节点和边。

图算法用于解决将图表示为网络的问题,例如航空公司航班、互联网如何连接或微信、QQ、微博上的社交网络连接。它们在NLP和机器学习中也很流行,用于形成网络。

一些顶级的图形算法包括:

  • 实现广度优先遍历
  • 实现深度优先遍历
  • 计算图级别中的节点数
  • 查找两个节点之间的所有路径
  • 查找图的所有连通分量
  • Dijkstra 算法在图数据中查找最短路径
  • 移除边缘

虽然图是离散数学不可或缺的一部分,但它们在计算机科学和编程中也有实际用途,包括以下内容:

  • 计算机程序中以图形表示的调用者-被调用者关系
  • 网站的链接结构可以用有向图来表示
  • 神经网络

图的属性

由 G 表示的图由一组顶点 (V)或在边 (E)处链接的节点表示。边的数量取决于顶点。边缘可以是有向的或无向的。

在有向图中,节点沿一个方向链接。这里的边显示了一种单向关系。

在无向图中,边是双向的,显示出双向关系。

示例:无向图的一个很好的用例是微信好友建议算法。用户(节点)有一个边缘运行到朋友 A(另一个节点),而朋友 A 又连接(或有一个边缘运行)到朋友 B。然后将朋友 B 推荐给用户。


还有许多其他复杂类型的图属于不同的子集。例如,当每个顶点都可以从其他每个顶点到达时,有向图就具有强连通分量。

顶点

顶点是多条线相交的点。它也称为节点。

边缘

边是一个数学术语,用于表示连接两个顶点的线。许多边可以由单个顶点形成。然而,没有顶点,就无法形成边。每条边必须有一个起始和结束顶点。

路径

图中的路径G=( V ,E )是顶点 v1, v2, …, vk 的序列,其属性是之间有边 vi 和 vi +1。我们说路径从v1到vk 。

序列 6,4,5,1,26,4,5,1,2 定义从节点 6 到节点 2 的路径。

类似地,可以通过遍历图的边来创建其他路径。如果路径的顶点全部不同,则路径很简单。

行走

行走是路径,但它们不需要一系列不同的顶点。

连通图

如果对于每对顶点,则图是连通的v和v,有一条路径从v到v。

循环

循环是一条路径 v1, v2, …, vk,满足以下条件:

  • k>2k>2k>2k _>2
  • 首先k-1顶点都不同
  • v1=vk

树是不包含环的连通图。

环形

在图中,如果从顶点到自身绘制一条边,则称为环。在图中,V 是一个顶点,其边 (V, V) 形成一个环。

如何在代码中表示图形

在我们继续使用图算法解决问题之前,首先了解如何在代码中表示图非常重要。图可以表示为邻接矩阵或邻接列表。

邻接矩阵

邻接矩阵是由图顶点标记的方阵,用于表示有限图。矩阵的条目指示顶点对在图中是否相邻。

在邻接矩阵表示中,需要迭代所有节点来识别节点的邻居。

a  b  c  d  e
a   1  1  -  -  -
b   -  -  1  -  -
c   -  -  -  1  -
d   -  1  1  -  -

邻接表

邻接表用于表示有限图。邻接列表表示允许轻松地遍历节点的邻居。列表中的每个索引代表顶点,与该索引链接的每个节点代表其相邻顶点。

1  a ->  { a b }
2  b ->  { c }
3  c ->  { d }
4  d ->  { b c }

对于下面的基图类,我们将使用邻接列表实现,因为它对于本文后面的算法解决方案执行得更快。

图类(Graph Class)

我们的图实现的要求相当简单。我们需要两个数据成员:图中顶点的总数和存储相邻顶点的列表。我们还需要一种添加边或一组边的方法。

class AdjNode:
    """
    表示节点邻接表的 类
    """
    def __init__(self, data):
        """
        构造函数
        :参数数据 : 顶点
        """
        self.vertex = data
        self.next = None

class Graph:
    """
    图类 ADT
    """

    def __init__(self, vertices):
        """
        构造函数
        :param vertices : 图中的总顶点数
        """
        self.V = vertices
        self.graph = [None] * self.V

        # 在无向图中添加边的函数

    def add_edge(self, source, destination):
        """
        添加边缘
        :param source: 源顶点
        :param destination: 目标顶点
        """

        # 将节点添加到源节点
        node = AdjNode(destination)
        node.next = self.graph[source]
        self.graph[source] = node

        # 如果无向图,将源节点添加到目标节点
        
        # 故意注释这一行,方便理解
        #node = AdjNode(source)
        #node.next = self.graph[destination]
        #self.graph[destination] = node

    def print_graph(self):
        """
        打印图标的函数
        """
        for i in range(self.V):
            print("Adjacency list of vertex {}\n head".format(i), end="")
            temp = self.graph[i]
            while temp:
                print(" -> {}".format(temp.vertex), end="")
                temp = temp.next
            print(" \n")


# 主程序
if __name__ == "__main__":

    V = 5  # 顶点总数
    g = Graph(V)
    g.add_edge(0, 1)
    g.add_edge(0, 4)
    g.add_edge(1, 2)
    g.add_edge(1, 3)
    g.add_edge(1, 4)
    g.add_edge(2, 3)
    g.add_edge(3, 4)

    g.print_graph()

在上面的示例中,我们看到了Python graph class。我们已经奠定了图形类的基础。变量 V 包含一个整数,指定顶点总数。下面示例的代码都会用到这个类。

如何实现广度优先遍历

给定一个表示为邻接列表和起始顶点的图,代码应该输出一个字符串,其中包含以正确的遍历顺序列出的图的顶点。当从起始顶点遍历图形时,将首先打印每个节点的右子节点,然后是左子节点。

为了解决这个问题,前面已经实现了 Graph 类。

输入:表示为邻接列表和起始顶点的图。

输出:一个字符串,其中包含以正确的遍历顺序列出的图的顶点。

示例输出:

result = "02143" 
or
result = "01234"

在开始实施之前,先看一下并设计一个分步算法。首先尝试自己解决。如果遇到困难,可以随时参考解决方案部分提供的解决方案。

bfs:

def bfs(graph, source):
    """
    打印图的 BFS 的函数
    :param graph: 图表
    :param source: 起始顶点
    :return:
    """

    # 写你的代码
    pass

解决方案

bfs:

def bfs(my_graph, source):
    """
    打印图的 BFS 函数
    :param graph: 图表
    :param source: 起始顶点
    :return:
    """
    
    # 将所有的顶点标识为未访问过
    visited = [False] * (len(my_graph.graph))

    # 创建 BFS 队列
    queue = []

    # 结果字符串
    result = ""

    # 将源节点表示为 访问过并将其排入队列
    queue.append(source)
    visited[source] = True

    while queue:

        # 经一个顶点重队列中取出
        # 排队并打印
        source = queue.pop(0)
        result += str(source)

        # 取出相邻的顶点
        # 出对的顶点源,
        #如果一个相邻的还没有访问过,那么标记一下
        # 访问过并将其排入队列
        while my_graph.graph[source] is not None:
            data = my_graph.graph[source].vertex
            if not visited[data]:
                queue.append(data)
                visited[data] = True
            my_graph.graph[source] = my_graph.graph[source].next

    return result


# 主要测试上面的程序
if __name__ == "__main__":
    
    V = 5
    g = Graph(V)
    g.add_edge(0, 1)
    g.add_edge(0, 2)
    g.add_edge(1, 3)
    g.add_edge(1, 4)

    print(bfs(g, 0))

我们从选定的节点开始,逐层遍历图。探索所有邻居节点。然后,我们进入下一个级别。我们水平遍历图表,也就是每一层。

图表可能包含循环。为了避免再次处理同一节点,我们可以使用布尔数组来标记访问过的数组。可以使用队列来存储节点并将其标记为已访问。队列应遵循先进先出(FIFO)排队方法。

如何实现深度优先遍历

在这个问题中,你必须实现深度优先遍历。为了解决这个问题,之前实现的图类已经提供了。

输入:表示为邻接列表和起始顶点的图。

输出:一个字符串,其中包含以正确的遍历顺序列出的图的顶点。

示例输出:

result = "01342" 
or
result = "02143"

在开始实施之前,先看一下并设计一个分步算法。首先尝试自己解决。如果遇到困难,可以随时参考解决方案部分提供的解决方案。

dfs:

def dfs(graph, source):
    """
    打印图的 DFS 的函数
    :param graph: 图表
    :param source: 起始顶点
    :return:
    """
    
    # 在这里写下你的代码!
    pass

解决方案

dfs:

def dfs(my_graph, source):
    """
    打印图的DFS的函数
    :param graph: 图表
    :param source: 起始顶点
    :return: 以字符串形式返回遍历结果
    """
    
    # 将所有顶点标记为未访问过
    visited = [False] * (len(my_graph.graph))

    # 创建 DFS 堆栈
    stack = []

    # 结果字符串
    result = ""

    # 拼接字符
    stack.append(source)

    while stack:

        # 从堆栈中弹出一个顶点
        source = stack.pop()
        
        if not visited[source]:
            result += str(source)
            visited[source] = True

        # 获取弹出顶点源的所有相邻顶点
        # 如果相邻的未必访问过,则将其压入
        while my_graph.graph[source] is not None:
            data = my_graph.graph[source].vertex
            if not visited[data]:
                stack.append(data)
            my_graph.graph[source] = my_graph.graph[source].next

    return result


# 主程序运行
if __name__ == "__main__":
    
    V = 5
    g = Graph(V)
    g.add_edge(0, 1)
    g.add_edge(0, 2)
    g.add_edge(1, 3)
    g.add_edge(1, 4)

    print(dfs(g, 0))

深度优先图算法利用了回溯的思想。这里的“回溯”是指只要当前路径上没有更多的节点,就向前移动,然后在同一条路径上向后移动,寻找要遍历的节点。

如何去除边缘

在此问题中,必须实现remove_edge以源和目标作为参数的函数。如果两者之间存在边,则应将其删除。

输入:图形、源(整数)和目标(整数)。

输出:对图进行 BFS 遍历,并删除源和目标之间的边。

首先,在开始实施之前仔细研究这个问题并设计一个分步算法。

remove_edge:

def remove_edge(graph, source, destination):
    """
    删除边缘函数
    :param graph: 图表
    :param source: 源顶点
    :param destination: 目标顶点
    """

    # 写代码
    pass

解决方案

如果熟悉的话,这个解决方案与链表中的删除非常相似。

我们的顶点存储在一个链接列表中。首先,我们访问source链表。如果源链表的头节点持有要删除的键,我们将头向前移动一步并返回图。

如果要删除的键位于链表的中间,我们会跟踪前一个节点,并在目的地遇到时将前一个节点与下一个节点连接起来。

总结

图算法是用于解决图(Graph)数据结构中的各种问题的算法,对广度优先和深度优先做了一些示例,还有注释,我们可以私下练习一下。

图算法能够帮助我们理解和处理复杂的关系型数据,并在实际应用中提供解决方案。

责任编辑:姜华 来源: 今日头条
相关推荐

2017-02-07 14:40:24

2022-11-09 15:06:43

人工智能

2021-04-02 15:18:13

智慧城市物联网

2022-06-19 23:20:47

区块链气候VCM

2016-06-02 09:03:48

2024-01-31 14:50:50

人工智能智慧城市

2011-09-10 21:05:04

密码管理浏览器插件

2021-05-16 15:42:52

大数据医疗隐私

2017-05-04 08:00:54

2022-10-09 11:46:55

机器人人工智能

2022-10-31 16:58:14

物联网

2022-08-03 14:38:41

人工智能动物语言机器学习

2023-05-23 10:31:53

人工智能物联网

2016-09-28 10:55:09

云解决开源架构师

2020-03-14 07:56:48

智慧农业物联网IOT

2019-09-04 17:52:03

人工智能社会福布斯

2020-08-11 07:00:00

人工智能

2021-01-14 12:17:52

大数据数据分析技术

2015-11-04 09:18:27

个性化程序Windows 10

2020-04-09 10:18:20

人工智能新冠疫情数据
点赞
收藏

51CTO技术栈公众号