Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

大数据 数据可视化
随着技术的发展,新的数据可视化工具不断涌现。下面将介绍五大可视化工具,并结合具体使用情况解释该在何时使用这些工具。

Excel想必大家都不陌生,作为职场标配软件,它既是典型的入门级数据可视化工具,也有着许多强大功能。

还记得我初入职场时,工作团队的标准可视化工具就是Excel。然而,人工处理数据耗费了大量时间,使我们无暇提出见解或建议。

随着技术的发展,新的数据可视化工具不断涌现。下面将介绍五大可视化工具,并结合具体使用情况解释该在何时使用这些工具。

五大可视化工具

1. Excel

Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

人人都在使用Excel,我从来没有遇过不用Excel的数据分析专家。不管你信不信,但这就是事实。如今,一些数据科学家仍主要使用Excel进行日常工作。

Excel的最大的好处在于,它无处不在。如果你想和他人共享文件,无需担心他们是否能打开文件。

此外,用Excel完成临时任务非常方便,比如在任意处调整一个数字。一切都是可视化的,你可以看到每个表格框的具体内容。

Excel要在可预见的未来占据一席之地,这两个优势就足够了。

2. Tableau

Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

大约在7年前,我开始使用Tableau。因为它是付费的,我们不得不为它构建商业案例。但这绝对是值得的。

Tableau有很多特性。例如,用户可以构建交互式仪表板,并将其提供给许多其他用户。这样就可以减少BI团队的工作量,成员可以独立地解决数据问题,不需要每次进行一些小更改时都来寻求帮助。

下面这些事情,我在Tableau中可以轻松完成,而在Excel中却无法轻易实现:

  • 想出一个制作方法,在几次拖放操作和几次单击中立即将数据可视化。
  • 依据变量水平分组(如将年龄变量分组为0-18、19-25…组),立即将结果反映在所有图表中。如果在Excel中有很多图表,这点能够助攻你的工作。
  • 动画。正确地使用方法能够让Tableau的动画传递静态图表无法传递的强大消息。

在我看来,探索性数据分析方面,没有什么工具能比得上Tableau。

3. Power BI

Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

Power BI与Tableau有很多相似之处。或许是偏见,但使用了一段时间之后,我发现Power BI在某些方面的用户体验确实不如Tableau。

例如,如果要对图表中的变量重新排序,需要创建一个自定义顺序,教程中用了11张屏幕截图进行说明。而在Tableau中,可以通过拖放操作在1到2个步骤中完成,节省了很多时间。

不过,我认为Power BI的仪表板性能更好,而且最重要的是,它有一个免费的桌面版(该版本不支持团队共享,但其功能对普通用户来说一般已经足够了)。

如果没有预算,但仍想提高工作效率,Power BI不失为一个好的选择。

4. Dash

Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

假设你已经建立了一个机器学习模型来预测每张保险单的盈利能力,与其让模型在硬盘上闲置,不如让公司的每个承销商将它用于日常工作。为此,可以构建一个基于Dash的web应用程序。

有这样一个示例:Jason Chan根据以往终极搏击锦标赛(UFC)比赛成绩,建立了一个机器学习模型,来预测未来的比赛结果。Jason并没有止步于此,而是让所有人都可以使用该模型。

注意:如果您更喜欢R而不是Python,可以去试试 R Shiny.

5. Plotly

Excel、Tableau……五大可视化工具,你真的知道怎样用吗?

Plotly提供了丰富的交互式图表,如果了解R或Python,这些图表将很有用处。Tableau中能执行的大多数图表都可以在Plotly中复制。

“如果我有了Tableau或Power BI,为什么需要Plotly?”

答案是可扩展性。

假设您正在按季度看保险资产的业务组合。有20种不同的分类变量,包括地区,产品,性别等。

如果精通Tableau,那么每个图表将花费2分钟的时间。总共需要2 * 20 =40分钟。

而搭配使用Python和Plotly,您可能需要花10分钟为第一张图表编写代码。(是的,编程比拖放困难!)

接下来花5分钟编写一个循环,为20个变量中的每个变量创建一个图表。总共是10+5=15分钟。

在for循环的帮助下,工作量的增长远小于20倍。此外,也可以保存工作代码用于以后的项目。

我一般会在Jupyter Notebook中使用Plotly,与同事分享代码。

如何为订阅者选择合适的工具

了解这五大可视化工具的功能之后,您可能会想在每个项目中都使用最先进的解决方案(Dash)。

这就像被深度学习的预测能力吸引了一样,你可能会想把其他所有的技术都扔进垃圾桶,手上的的每个项目都使用深度学习方法。

这是一个非常糟糕的做法。

我们需要考虑受众,并根据他们的需求调整可视化方法,把他们进行分组是一个不错的做法。

[[320348]]

组1:高管

这些人是组织的关键决策者。他们时间很紧,更关心的是见解和建议,而不是技术细节。你要回答他们这些问题:

  • 正在发生什么?
  • 为什么要发生?
  • 我们应该怎样做?我在承担何种风险?

对他们来说,最好的可视化方法是放一些幻灯片,直接回答这些问题。

可以使用Tableau、Plotly甚至Excel来创建图形。没关系,重要的是需要直接简洁地回答关键问题。否则,受众会不耐烦,您的努力相当于白费功夫。

组2:运营者

这些人将您的可视化成果作为工具。以保险业为例:

  • 对于承销商,可以构建一个交互式仪表板,以便他们可以评估其承销的每项商业财产风险。
  • 对于索赔调查人员,可以构建一个交互式欺诈评分web应用程序,为高风险索赔提供预警。

再如,自行车共享平台的修理工可以在互动仪表板上进行回复,以查找附近的破损自行车并进行收集和检查。

从工具选择的角度上看,如果已经使用了Power BI或Tableau,那么遵循现有方法是有意义的。

如果想从头开始构建,并充分利用灵活性,可以使用Dash。

[[320349]]

组3:分析专家

对于这群人,更推荐使用Jupyter Notebooks绘制Plotly图。

可以用它们轻松提供可重复的分析,包括代码、输出和图表在内,所有内容都集中在一起,便于同行评审。

如果是简单的临时分析,使用Tableau和Excel也是不错的选择。

组4:其他利益相关者

虽然以上3个组通常代表最重要的利益相关者,但有时也可能会遇到其他的利益相关者。

如果是技术人员,用第3组的方法就不错。

如果是非技术人员,那么Excel,Tableau或Power BI都可能是很好的选择。只要确保订阅者可以访问该软件并知道如何使用它即可。

结论

作为数据科学家,我们花了很多时间研究数据和建立模型,但我们是否花了足够的时间考虑受众?他们是谁?他们的技术能力如何?我们如何才能以最吸引他们的方式交付结果?

没有一种工具占据绝对优势。对于特定的受众,某些工具比其他工具更合适。

想要充分发挥数据科学的威力,我们要尽最大努力将数据驱动的建议转化为现实行动——无论是使产品线更有利可图,还是检测更多欺诈案例抑或实现收入最大化。

[[320350]]

用户思维很重要,了解你的受众,选择最适合的方式,将会达到事半功倍的效果。

 

责任编辑:赵宁宁 来源: 读芯术
相关推荐

2014-02-09 16:20:20

大数据

2020-07-16 15:10:46

工具可视化Python

2020-11-01 16:49:51

数据分析可视化工具数据

2024-11-04 08:49:11

2022-05-16 11:39:46

云架构云可视化CROPS

2018-05-31 08:25:13

误区工具可视化

2023-03-06 08:03:10

Python可视化工具

2021-02-25 15:19:04

文件App苹果功能

2021-09-03 08:00:00

开源工具游戏

2017-10-13 11:13:16

微信隐藏功能视频编辑

2019-09-12 08:42:38

工具可视化BI系统

2021-04-14 16:20:39

可视化大数据工具

2017-07-03 16:44:10

数据库MongoDBNoSQL

2021-03-30 10:10:37

PyTorch可视化工具命令

2020-12-15 09:43:20

Python可视化工具网络应用

2022-01-17 11:09:46

数据可视化工具开发

2009-06-01 09:34:22

2019-06-11 09:35:34

可视化工具图形

2016-08-21 15:38:31

大数据可视化工具

2020-11-15 18:00:49

开源可视化工具Python
点赞
收藏

51CTO技术栈公众号