数据可视化,我习惯于用这些工具

大数据 数据可视化
本文主要涵盖数据可视化工具主要包括4类:Excel图表、Python绘图库、Tableau以及网页在线工具等。

[[373791]]

 本文主要涵盖数据可视化工具主要包括4类:Excel图表、Python绘图库、Tableau以及网页在线工具等。

01 Excel

网传数据分析师必备基础套餐是ESP,即Excel+SQL+Python,这种说法不见得完全正确,但也确有一定道理,其中Excel更是几乎每名数据分析师乃至每名职场人士必备的办公工具。

个人也习惯于应用Excel,更具体说主要是应用Excel的三类功能:图表制作、内置函数以及数据透视表。一般而言,当数据量较小(100以内)时,个人非常倾向于用Excel完成图表插入,不仅简洁方便,而且内置的多种样式、丰富的设置选项以及所见即所得的制图体验,都无疑是小数据量作图的首选。

▲Excel内置了丰富的图表类型

Excel支持的图表类型也极为丰富,除了常规的条形图、折线图、饼图和散点图之外,像雷达图、旭日图、箱线图等视觉效果更好的图表也是支持的。同时更是支持了丰富的设置效果,而且都是极为简便易懂的,几乎不需要教程即可摸索掌握。

02 Python可视化库

作为一名数据分析师,Python几乎是必须掌握的;而在Python数据分析相关的众多第三方包中,可视化库又非常强大。在这其中,个人尤为常用的有5个相关库:

1. Matplotlib

该库与Numpy和pandas号称Python数分三剑客,也是当初配合Numpy和scipy替代Matlab的重要一环,几乎是Python数据分析过程中必须熟练掌握的绘图库。

不过需要承认的是,Matplotlib功能强大,但其实相对更加偏向底层,提供了大量的参数和接口来设置图表各种细节,对于初学者来说并不那么友好。但实话说,在彻底掌握其核心思想之后,其实还是比较符合正常思维的。

这里,附个人总结的Matplotlib完整入门教程:Matplotlib入门详细教程

2. seaborn

既然Matplotlib过于偏向底层,绘图也较为繁琐,那有没有简单易上手的绘图库呢?seaborn其实算得上一个,不过也并不算是Matplotlib的升级或替代品,而只能算是有力补充。

相较而言,seaborn基于Matplotlib,提供了更为丰富的样式,具有更加简洁的API接口,一两句代码就能完成非常强大的图表绘制。

附seaborn入门教程:Python数据科学系列:seaborn入门详细教程

3. Pyecharts

相较于Matplotlib和seaborn这种更像是Python官方绘图库,Pyecharts属于纯粹的第三方绘图库,即Pyecharts=Python+Echarts,即百度Echarts与Python的结合体,某种程度上也再次印证了Python胶水语言的特性。

更重要的是,Pyecharts支持动态图表绘制,支持交互式图表,除了Web展示,还可通过一定操作移植到PPT中,这也为数据分析师做汇报添彩不少。

Pyecharts目前经历了两个大的版本,尤其是在0.5升级到1.x以后,几乎完全变了绘图接口,但整体来说是变得更加简洁易懂。

附Pyecharts绘图简洁教程:Pyecharts极简入门教程

4. pandas

与Matplotlib同享数分三剑客的美誉,而且更有瑞士军刀名号的pandas,实际上也是一个非常便捷的绘图库。更准确地说,这是一个面向dataframe对象的绘图接口,通过调用plot()接口或者plot属性,从而可以完成主流Matplotlib中图表的绘制,且几乎继承了Matplotlib中相应图表的所有参数设置,包括设置多子图绘制等,简直不能更丝滑。

近期,随着版本的升级,pandas绘图后端更是可以指定其他绘图底层接口,使用起来极为方便。想象一下:你在操作着dataframe的各种处理和转换,突然想看看当前处理的数据什么样,那么就一言不合就来个图表。简单的pandas绘图方法可查看pandas教程中的最后一部分。

5. geopandas

geopandas是一个继承自pandas的地理信息数据处理库,其核心数据接口geodataframe本质上就是在pandas的dataframe数据结构上增加一列geometry,体现空间信息。

除了继承了pandas的各种数据处理接口外,geopandas还增强了画图功能,在一个具有geometry列信息的geodataframe中,直接调用.plot()接口,即可快速查看当前地理信息情况。

下图是混用Matplotlib和geopandas.plot()的直接绘图结果,仅需额外设置用于标识数值大小的一列,即可绘制五颜六色的炫丽图片。(当前选用颜色风格为rainbow,可明显看出颜色从深到浅依次为红橙黄绿青蓝紫)

03 Tableau

曾经,为了丰富个人可视化技能、拓宽数据分析工具,也专门花了一段时间学习tableau的运用,这可能也是商业数据分析师的必备技能之一,不过个人目前也仅仅是偶尔用它画个图而已。

tableau本身功能还是极其强大的,支持多种数据源读取、内置了类SQL的字段处理功能、提供了丰富的图表库,工作表->仪表板->故事,三者层层递进,对于大屏展示和快速完成数据分析可视化报表异常高效,尤为擅长周期性动态监管的数据指标类仪表板。

灵活的数据加载、强大的数据转换、简单的字段拖拽即可出图,这些都保证了快速生成报表的可能性。

04 网页在线工具

随着信息技术的不断成熟,其实很多数据可视化工作也逐渐搬移到线上轻量级完成,一些网页在线工具专门用于执行数据可视化,通过简单的灌入数据,一张张样式丰富的图表便很快呈现,而且大多都是零门槛易实现。这里仅列举两个:

1. 百度Echarts

这真算的上是百度的一个良心工具了,内置了大量的图表模板,仅需选定样式->更改数据即可轻松实现,而且支持交互。前面介绍的Pyecharts其实就是百度Echarts的Python语言版。

2. 词云在线网站

其实词云在线网站还是比较多的,这里不具体给出,有兴趣的话可参考此前的推送:生成词云的5种方式,你用过几种?

05 小结

数据可视化对于一名数据分析师而言确实很重要,好的可视化效果甚至称得上是安身立命装X加薪之本。然而,虽然可视化图表选择众多,但其实也不能过于追求标新立异,例如桑基图、瀑布图、南丁格尔图等,特定场景下用用可能效果感人。

但绝大多数情况下,Simple is better than complex,折线图、条形图、饼图、散点图这四大基本图表类型仍然是朴实无华的首选。 

 

责任编辑:庞桂玉 来源: 大数据DT
相关推荐

2020-12-28 10:20:57

数据可视化工具大数据

2013-07-17 13:50:06

恶意软件Chrome 浏览器

2023-05-06 12:57:34

Python工具

2020-03-11 14:39:26

数据可视化地图可视化地理信息

2015-11-26 10:41:38

数据可视化

2017-10-14 13:54:26

数据可视化数据信息可视化

2017-10-19 21:56:55

数据可视化大数据数据

2018-09-26 16:15:31

数据可视化大数据数据分析

2021-02-21 08:11:46

PythonDash工具

2017-04-19 08:32:50

大数据数据可视化编程工具

2013-05-07 14:56:27

大数据应用工具数据中心网络

2024-08-20 14:31:16

2018-02-04 22:22:46

大数据开发工具

2022-01-17 11:09:46

数据可视化工具开发

2015-08-20 10:00:45

可视化

2021-02-07 20:23:09

GoogeBlockly可视化编程

2022-03-03 13:02:37

可视化网页低代码编程工具

2018-05-31 08:25:13

误区工具可视化

2023-04-14 08:21:55

2020-06-03 07:00:00

数据可视化大数据
点赞
收藏

51CTO技术栈公众号