实现动态展示多算法,这个Python库助你发现网络图社区结构

新闻 前端 算法
熟知社区发现算法,你不能错过这个 Python 库。它涵盖 Louvain 算法、Girvan-Newman 算法等多种社区发现算法,还具有可视化功能。

 [[382977]]

熟知社区发现算法,你不能错过这个 Python 库。它涵盖 Louvain 算法、Girvan-Newman 算法等多种社区发现算法,还具有可视化功能。

网络是由一些紧密相连的节点组成的,并且根据不同节点之间连接的紧密程度,网络也可视为由不同簇组成。簇内的节点之间有着更为紧密的连接,不同簇之间的连接则相对稀疏。这种簇被称为网络中的社区结构(community structure)。

由此衍生出来的社区发现(community detection)算法用来发现网络中的社区结构,这类算法包括 Louvain 算法、Girvan-Newman 算法以及 Bron-Kerbosch 算法等。

最近,机器之心在 GitHub 上发现了一个可以发现图中社区结构的 Python 库 communities,该库由软件工程师 Jonathan Shobrook 创建。

实现动态展示多算法,这个Python库助你发现网络图社区结构

项目地址:https://github.com/shobrook/communities

首先,该库可以实现以下几种社区发现算法:

  • Louvain 算法
  • Girvan-Newman 算法
  • 层次聚类
  • 谱聚类
  • Bron-Kerbosch 算法

其次,用户还可以使用 communities 库来可视化上述几种算法,下图为空手道俱乐部(Zachary's karate club)网络中 Louvain 算法的可视化结果:

实现动态展示多算法,这个Python库助你发现网络图社区结构

该库的安装方法也非常简单,可采用 pip 的方式安装 communities,代码如下:

  1. $ pip install communities 

对于这个 Python 库,很多网友给予了高度评价,表示会去尝试。

实现动态展示多算法,这个Python库助你发现网络图社区结构

算法详解

Louvain 算法

  1. louvain_method(adj_matrix : numpy.ndarray, n : int = None) -> list 

该算法来源于文章《Fast unfolding of communities in large networks》,简称为 Louvian。

作为一种基于模块度(Modularity)的社区发现算法,Louvain 算法在效率和效果上都表现比较好,并且能够发现层次性的社区结构,其优化的目标是最大化整个图属性结构(社区网络)的模块度。

Louvain 算法对最大化图模块性的社区进行贪婪搜索。如果一个图具有高密度的群体内边缘和低密度的群体间边缘,则称之为模图。

示例代码如下:

  1. from communities.algorithms import louvain_methodad 
  2.  
  3.  
  4. j_matrix = [...] 
  5. communities, _ = louvain_method(adj_matrix) 

Girvan-Newman 算法

  1. girvan_newman(adj_matrix : numpy.ndarray, n : int = None) -> list 

该算法来源于文章《Community structure in social and biological networks》。

Girvan-Newman 算法迭代删除边以创建更多连接的组件。每个组件都被视为一个 community,当模块度不能再增加时,算法停止去除边缘。

示例代码如下:

  1. from communities.algorithms import girvan_newman 
  2.  
  3.  
  4. adj_matrix = [...] 
  5. communities, _ = girvan_newman(adj_matrix) 

层次聚类

  1. hierarchical_clustering(adj_matrix : numpy.ndarray, metric : str = "cosine", linkage : str = "single", n : int = None) -> list 

层次聚类实现了一种自底向上、分层的聚类算法。每个节点从自己 的社区开始,然后,随着层次结构的建立,最相似的社区被合并。社区会一直被合并,直到在模块度方面没有进一步的进展。

示例代码如下:

  1. from communities.algorithms import hierarchical_clustering 
  2.  
  3.  
  4. adj_matrix = [...] 
  5. communities = hierarchical_clustering(adj_matrix, metric="euclidean", linkage="complete"

谱聚类

  1. spectral_clustering(adj_matrix : numpy.ndarray, k : int) -> list 

这种类型的算法假定邻接矩阵的特征值包含有关社区结构的信息。

示例代码如下:

  1. from communities.algorithms import spectral_clustering 
  2.  
  3.  
  4. adj_matrix = [...] 
  5. communities = spectral_clustering(adj_matrix, k=5

Bron-Kerbosch 算法

  1. bron_kerbosch(adj_matrix : numpy.ndarray, pivot : bool = False) -> list 

Bron-Kerbosch 算法实现用于最大团检测(maximal clique detection)。图中的最大团是形成一个完整图的节点子集,如果向该子集中添加其他节点,则它将不再完整。将最大团视为社区是合理的,因为团是图中连接最紧密的节点群。因为一个节点可以是多个社区的成员,所以该算法有时会识别重叠的社区。

示例代码如下:

  1. from communities.algorithms import bron_kerbosch 
  2.  
  3.  
  4. adj_matrix = [...] 
  5. communities = bron_kerbosch(adj_matrix, pivot=True) 

可视化

绘图

  1. draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1

可视化图(graph),将节点分组至它们所属的社区和颜色编码中。返回代表绘图的 matplotlib.axes.Axes。示例代码如下:

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import draw_communities 
  3.  
  4.  
  5. adj_matrix = [...] 
  6. communities, frames = louvain_method(adj_matrix) 
  7.  
  8.  
  9. draw_communities(adj_matrix, communities) 

可视化图如下:

实现动态展示多算法,这个Python库助你发现网络图社区结构

Louvain 算法的动图展示

  1. louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2

Louvain 算法在图中的应用可以实现动图展示,其中每个节点的颜色代表其所属的社区,并且同一社区中的节点聚类结合在一起。

示例代码如下:

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import louvain_animation 
  3.  
  4.  
  5. adj_matrix = [...] 
  6. communities, frames = louvain_method(adj_matrix) 
  7.  
  8.  
  9. louvain_animation(adj_matrix, frames) 

动图展示如下:

实现动态展示多算法,这个Python库助你发现网络图社区结构

 

 

责任编辑:张燕妮 来源: 机器之心Pro
相关推荐

2011-03-02 09:09:10

2022-11-24 14:46:14

网络社区发现

2011-01-25 09:31:01

设计元素UIwebOS

2012-09-28 13:13:32

Win 7

2015-07-01 09:35:16

Java批量下载网络图片

2011-01-07 13:33:07

Google平板系统蜂巢Android 3.0

2011-04-18 17:25:34

Symbian Ann诺基亚

2015-10-08 10:51:21

Build 10551多图Windows 10

2021-02-25 15:21:27

Python 开发编程语言

2020-02-13 11:47:05

GitHub代码开发者

2011-01-27 10:11:42

Android 3.0

2023-04-26 06:22:45

NLPPython知识图谱

2021-06-15 07:33:13

Java函数式编程

2010-01-27 17:53:18

Android显示网络

2023-09-25 12:23:18

Python

2011-01-13 10:51:12

百卓网络上网行为管理网络控制

2021-04-19 09:08:19

无向图数据结构

2021-08-31 09:45:15

神经网络数据语音

2021-03-08 09:48:35

图聚类Python可视化

2022-04-28 20:58:48

搜索界面微软Windows 1
点赞
收藏

51CTO技术栈公众号