用 Python 绘制数据的7种流行的方法

开发 后端
本篇文章比较七个在 Python 中绘图的库和 API,看看哪个最能满足你的需求。

“如何在 Python 中绘图?”曾经这个问题有一个简单的答案:Matplotlib 是唯一的办法。如今,Python 作为数据科学的语言,有着更多的选择。你应该用什么呢?

本指南将帮助你决定。

它将向你展示如何使用四个最流行的 Python 绘图库:Matplotlib、Seaborn、Plotly 和 Bokeh,再加上两个值得考虑的优秀的后起之秀:Altair,拥有丰富的 API;Pygal,拥有漂亮的 SVG 输出。我还会看看 Pandas 提供的非常方便的绘图 API。

对于每一个库,我都包含了源代码片段,以及一个使用 Anvil 的完整的基于 Web 的例子。Anvil 是我们的平台,除了 Python 之外,什么都不用做就可以构建网络应用。让我们一起来看看。

示例绘图

每个库都采取了稍微不同的方法来绘制数据。为了比较它们,我将用每个库绘制同样的图,并给你展示源代码。对于示例数据,我选择了这张 1966 年以来英国大选结果的分组柱状图。

Bar chart of British election data我从维基百科上整理了英国选举史的数据集:从 1966 年到 2019 年,保守党、工党和自由党(广义)在每次选举中赢得的英国议会席位数,加上“其他”赢得的席位数。你可以以 CSV 文件格式下载它。

Matplotlib

Matplotlib 是最古老的 Python 绘图库,现在仍然是最流行的。它创建于 2003 年,是 SciPy Stack 的一部分,SciPy Stack 是一个类似于 Matlab 的开源科学计算库。

Matplotlib 为你提供了对绘制的精确控制。例如,你可以在你的条形图中定义每个条形图的单独的 X 位置。下面是绘制这个图表的代码(你可以在这里运行):

  1. import matplotlib.pyplot as plt 
  2.    import numpy as np 
  3.    from votes import wide as df 
  4.    # Initialise a figure. subplots() with no args gives one plot. 
  5.    fig, ax = plt.subplots() 
  6.    # A little data preparation 
  7.    years = df['year'] 
  8.    x = np.arange(len(years)) 
  9.    # Plot each bar plot. Note: manually calculating the 'dodges' of the bars 
  10.    ax.bar(x - 3*width/2, df['conservative'], width, label='Conservative'color='#0343df'
  11.    ax.bar(x - width/2, df['labour'], width, label='Labour'color='#e50000'
  12.    ax.bar(x + width/2, df['liberal'], width, label='Liberal'color='#ffff14'
  13.    ax.bar(x + 3*width/2, df['others'], width, label='Others'color='#929591'
  14.    # Customise some display properties 
  15.    ax.set_ylabel('Seats') 
  16.    ax.set_title('UK election results') 
  17.    ax.set_xticks(x)    # This ensures we have one tick per year, otherwise we get fewer 
  18.    ax.set_xticklabels(years.astype(str).values, rotation='vertical'
  19.    ax.legend() 
  20.    # Ask Matplotlib to show the plot 
  21.    plt.show() 

这是用 Matplotlib 绘制的选举结果:

Matplotlib plot of British election data

Seaborn

Seaborn 是 Matplotlib 之上的一个抽象层;它提供了一个非常整洁的界面,让你可以非常容易地制作出各种类型的有用绘图。

不过,它并没有在能力上有所妥协!Seaborn 提供了访问底层 Matplotlib 对象的逃生舱口,所以你仍然可以进行完全控制。

Seaborn 的代码比原始的 Matplotlib 更简单(可在此处运行):

  1. import seaborn as sns 
  2. from votes import long as df 
  3. # Some boilerplate to initialise things 
  4. sns.set() 
  5. plt.figure() 
  6. # This is where the actual plot gets made 
  7. ax = sns.barplot(data=dfx="year"y="seats"hue="party"palette=['blue', 'red', 'yellow', 'grey'], saturation=0.6) 
  8. # Customise some display properties 
  9. ax.set_title('UK election results') 
  10. ax.grid(color='#cccccc'
  11. ax.set_ylabel('Seats') 
  12. ax.set_xlabel(None) 
  13. ax.set_xticklabels(df["year"].unique().astype(str), rotation='vertical'
  14. # Ask Matplotlib to show it 
  15. plt.show() 

并生成这样的图表:

Seaborn plot of British election data

Plotly

Plotly 是一个绘图生态系统,它包括一个 Python 绘图库。它有三个不同的接口:

  • 一个面向对象的接口。
  • 一个命令式接口,允许你使用类似 JSON 的数据结构来指定你的绘图。
  • 类似于 Seaborn 的高级接口,称为 Plotly Express。

Plotly 绘图被设计成嵌入到 Web 应用程序中。Plotly 的核心其实是一个 JavaScript 库!它使用 D3 和 stack.gl 来绘制图表。

你可以通过向该 JavaScript 库传递 JSON 来构建其他语言的 Plotly 库。官方的 Python 和 R 库就是这样做的。在 Anvil,我们将 Python Plotly API 移植到了 Web 浏览器中运行。

这是使用 Plotly 的源代码(你可以在这里运行):

  1. import plotly.graph_objects as go 
  2.     from votes import wide as df 
  3.     #  Get a convenient list of x-values 
  4.     years = df['year'] 
  5.     x = list(range(len(years))) 
  6.     # Specify the plots 
  7.     bar_plots = [ 
  8.         go.Bar(xx=x, y=df['conservative'], name='Conservative'marker=go.bar.Marker(color='#0343df')), 
  9.         go.Bar(xx=x, y=df['labour'], name='Labour'marker=go.bar.Marker(color='#e50000')), 
  10.         go.Bar(xx=x, y=df['liberal'], name='Liberal'marker=go.bar.Marker(color='#ffff14')), 
  11.         go.Bar(xx=x, y=df['others'], name='Others'marker=go.bar.Marker(color='#929591')), 
  12.     ] 
  13.     # Customise some display properties 
  14.     layout = go.Layout( 
  15.         title=go.layout.Title(text="Election results"x=0.5), 
  16.         yaxis_title="Seats"
  17.         xaxis_tickmode="array"
  18.         xaxis_tickvals=list(range(27)), 
  19.         xaxis_ticktext=tuple(df['year'].values), 
  20.     ) 
  21.     # Make the multi-bar plot 
  22.     fig = go.Figure(data=bar_plotslayoutlayout=layout) 
  23.     # Tell Plotly to render it 
  24.     fig.show() 

Bokeh

Bokeh(发音为 “BOE-kay”)擅长构建交互式绘图,所以这个标准的例子并没有将其展现其最好的一面。和 Plotly 一样,Bokeh 的绘图也是为了嵌入到 Web 应用中,它以 HTML 文件的形式输出绘图。

下面是使用 Bokeh 的代码(你可以在这里运行):

  1. from bokeh.io import show, output_file 
  2.    from bokeh.models import ColumnDataSource, FactorRange, HoverTool 
  3.    from bokeh.plotting import figure 
  4.    from bokeh.transform import factor_cmap 
  5.    from votes import long as df 
  6.    # Specify a file to write the plot to 
  7.    output_file("elections.html") 
  8.    # Tuples of groups (year, party) 
  9.    x = [(str(r[1]['year']), r[1]['party']) for r in df.iterrows()] 
  10.    y = df['seats'] 
  11.    # Bokeh wraps your data in its own objects to support interactivity 
  12.    source = ColumnDataSource(data=dict(xx=x, yy=y)) 
  13.    # Create a colourmap 
  14.    cmap = { 
  15.        'Conservative': '#0343df', 
  16.        'Labour': '#e50000', 
  17.        'Liberal': '#ffff14', 
  18.        'Others': '#929591', 
  19.    } 
  20.    fill_color = factor_cmap('x', palette=list(cmap.values()), factors=list(cmap.keys()), start=1end=2
  21.    # Make the plot 
  22.    p = figure(x_range=FactorRange(*x), width=1200title="Election results"
  23.    p.vbar(x='x'top='y'width=0.9, sourcesource=source, fill_colorfill_color=fill_color, line_color=fill_color
  24.    # Customise some display properties 
  25.    p.y_range.start = 0 
  26.    p.x_range.range_padding = 0.1 
  27.    p.yaxis.axis_label = 'Seats' 
  28.    p.xaxis.major_label_orientation = 1 
  29.    p.xgrid.grid_line_color = None 

图表如下:

Bokeh plot of British election data

Altair

Altair 是基于一种名为 Vega 的声明式绘图语言(或“可视化语法”)。这意味着它具有经过深思熟虑的 API,可以很好地扩展复杂的绘图,使你不至于在嵌套循环的地狱中迷失方向。

与 Bokeh 一样,Altair 将其图形输出为 HTML 文件。这是代码(你可以在这里运行):

  1. import altair as alt 
  2.     from votes import long as df 
  3.     # Set up the colourmap 
  4.     cmap = { 
  5.         'Conservative': '#0343df', 
  6.         'Labour': '#e50000', 
  7.         'Liberal': '#ffff14', 
  8.         'Others': '#929591', 
  9.     } 
  10.     # Cast years to strings 
  11.     df['year'] = df['year'].astype(str) 
  12.     # Here's where we make the plot 
  13.     chart = alt.Chart(df).mark_bar().encode( 
  14.         x=alt.X('party', title=None), 
  15.         y='seats'
  16.         column=alt.Column('year', sort=list(df['year']), title=None), 
  17.         color=alt.Color('party', scale=alt.Scale(domain=list(cmap.keys()), range=list(cmap.values()))) 
  18.     ) 
  19.     # Save it as an HTML file. 
  20.     chart.save('altair-elections.html') 

结果图表:

Altair plot of British election dataPygal

Pygal

专注于视觉外观。它默认生成 SVG 图,所以你可以无限放大它们或打印出来,而不会被像素化。Pygal 绘图还内置了一些很好的交互性功能,如果你想在 Web 应用中嵌入绘图,Pygal 是另一个被低估了的候选者。

代码是这样的(你可以在这里运行它):

  1. import pygal 
  2.    from pygal.style import Style 
  3.    from votes import wide as df 
  4.    # Define the style 
  5.    custom_style = Style
  6.        colors=('#0343df', '#e50000', '#ffff14', '#929591') 
  7.        font_family='Roboto,Helvetica,Arial,sans-serif'
  8.        background='transparent'
  9.        label_font_size=14
  10.    ) 
  11.    # Set up the bar plot, ready for data 
  12.    c = pygal.Bar( 
  13.        title="UK Election Results"
  14.        style=custom_style
  15.        y_title='Seats'
  16.        width=1200
  17.        x_label_rotation=270
  18.    ) 
  19.    # Add four data sets to the bar plot 
  20.    c.add('Conservative', df['conservative']) 
  21.    c.add('Labour', df['labour']) 
  22.    c.add('Liberal', df['liberal']) 
  23.    c.add('Others', df['others']) 
  24.    # Define the X-labels 
  25.    c.x_labels = df['year'] 
  26.    # Write this to an SVG file 
  27.    c.render_to_file('pygal.svg') 

绘制结果:

Pygal plot of British election data

Pandas

Pandas 是 Python 的一个极其流行的数据科学库。它允许你做各种可扩展的数据处理,但它也有一个方便的绘图 API。因为它直接在数据帧上操作,所以 Pandas 的例子是本文中最简洁的代码片段,甚至比 Seaborn 的代码还要短!

Pandas API 是 Matplotlib 的一个封装器,所以你也可以使用底层的 Matplotlib API 来对你的绘图进行精细的控制。

这是 Pandas 中的选举结果图表。代码精美简洁!

  1. from matplotlib.colors import ListedColormap 
  2.  from votes import wide as df 
  3.  cmap = ListedColormap(['#0343df', '#e50000', '#ffff14', '#929591']) 
  4.  ax = df.plot.bar(x='year'colormap=cmap
  5.  ax.set_xlabel(None) 
  6.  ax.set_ylabel('Seats') 
  7.  ax.set_title('UK election results') 
  8.  plt.show() 

绘图结果:

Pandas plot of British election data要运行这个例子,请看这里

以你的方式绘制

Python 提供了许多绘制数据的方法,无需太多的代码。虽然你可以通过这些方法快速开始创建你的绘图,但它们确实需要一些本地配置。如果需要,Anvil 为 Python 开发提供了精美的 Web 体验。祝你绘制愉快!

 

 

 

责任编辑:赵宁宁 来源: Linux中国
相关推荐

2017-11-03 10:40:25

Python复制文件方法

2019-10-10 10:19:23

智能数据大数据软件

2020-06-12 07:57:55

Java框架编程语言Java

2020-01-06 10:01:12

JavaScript浏览器HTML

2020-05-27 10:49:33

智慧城市物联网病毒

2021-12-01 23:16:44

工具数据处理

2020-05-29 09:56:31

数据分析数据大数据

2021-09-08 13:27:49

人工智能物流行业AI

2019-05-08 12:15:12

Web挖掘工具

2020-04-27 08:44:07

语音欺诈黑客恶意攻击

2013-07-19 11:12:28

虚拟化数据丢失

2013-04-19 09:47:30

虚拟化数据

2020-10-28 09:45:02

安全数据泄露网络

2019-12-10 13:37:07

大数据社交媒体

2013-05-13 09:25:58

虚拟化数据丢失

2020-04-26 10:05:29

编程程序员技术

2018-01-10 17:06:36

Python线性回归数据

2018-09-14 14:27:43

2018-03-13 09:34:30

人工智能编程语言Python

2019-10-29 14:01:59

CIOIT创造力商业
点赞
收藏

51CTO技术栈公众号