7种最常见的数据可视化错误

大数据
在数据可视化领域,正如同在其它领域一样,都有一定的规则、最佳实践、指导方针,然后就是常识。与我们的认识恰恰相反的是,常识是往往被忽略的,这一点我们会在下面的例子中看到。

在数据可视化领域,正如同在其它领域一样,都有一定的规则、***实践、指导方针,然后就是常识。与我们的认识恰恰相反的是,常识是往往被忽略的,这一点我们会在下面的例子中看到。

就让我们从一些最常见的错误开始吧!

不要把数字加起来

当你画一个饼图、堆叠柱形图或是堆叠面积图时,所有数字的总和加起来应该是100。听上去似乎这种愚蠢的错误根本没必要指出,但你会因为人们多次犯这样的错误而感到惊讶。请看来自福克斯新闻的这一图片:

数据可视化


你能看出有什么问题吗?这三个扇形的数字加起来不是100%而是193%。在该调查中,很可能是允许一人投好几票的,因此饼图很明显不是能够体现这一数据的正确选择。

另外,如果你不读这些数字,只是观察饼图的大小,你会有这样一个印象:每位候选人得到的支持都将近三分之一。这又是一个错误的结论。

为了避免这样的错误,请仔细检查你的数字并且确保自己使用了标准的工具。这些工具不会让你做出像这样的错误的饼图。

不遵守惯例

就像饼图的各部分加起来应该是100,一个曲线图的曲线向右上移动表示数字的增长。因此,当你看到这个图表时你认为从2005年到2012年发生了什么?

数据可视化


一般的惯例会让你认为弗罗里达死于枪击的人数在2005到2012年间有所下降。但当你仔细观察时你会意识到Y轴是颠倒的。零值在顶部而***值在底部,这违背了通常随着曲线的上升值变大的惯例。

你不需要什么特别的东西去避免这些错误。我们已经看了足够的图表,从而对什么是标准有一个大体的概念。只有这样做,你才不会出错。也许在某些情况下你需要违反约定,但这将是一个例外,而不是规则。
裁切不当的数据轴

坐标的值是为图表提供上下文并理解,弄错坐标直观上你会得出完全错误的图片。为了更好地理解我的观点,请观察以下图表。

数据可视化

福克斯新闻裁掉了Y轴。现在看来,七百多万的图形高度好像是六百万的三倍。这当然不是这样的情况。这里是被纠正过的图表。

数据可视化


这幅图是不是更好一些?这幅图以0作为基准线的y轴显示出的数据,表现出了准确的图像。

这里有相同错误的另外一个例子。

数据可视化


你只要不将y轴弄乱就可以避免这项错误。当必须要展示细节的时候,先用一个图表给出综合性的消息,然后再第二个图表中具体阐释***个图表的某一方面。

不使用注解

算不上是错误,但无疑的是在你每次做图表时都会有一些小的缺失。有时候,在图中仅仅可视化是不够的,你需要在图表中加入一些描述性的文字或者数字使之变得更有意义。要理解我的观点,请观察如下图表。(使用谷歌图表制成)

数据可视化

这是一个非常好的图表,有着准确的标题和坐标轴,但是当你观察它的时候,你会不停的去想2015年发生了什么。是什么引发了销售数字的突然下降?

为了回答这个问题,你需要包括附有下降原因的正确注解:

数据可视化

现在这个比之前更好一些了吧?作为了一个读者,你不仅知道下降已发生了,还知道为什么发生了“下降”。

不正确的气泡尺寸

气泡图对于在二维空间显示三维数据是非常有用的。不仅有x轴和y轴,而且你可以通过改变气泡大小描绘第三种数量。

截至目前,我见过制作气泡图最普遍的问题就是他们改变气泡的半径而不是改变他们的区域来显示不同的数值。例如,请看这个图表。

数据可视化

我知道这里存在许多错误,但是为了理解刚才提到的这点,请观察最左边的气泡。他们代表的是9.2亿美元和18.4亿美元。但是这对吗?大气泡看上去是小气泡的四倍。如果你不读气泡内的文字,你肯定会产生误解。

如果你只是改变数据的区域而不是改变其半径比例的话,你就会很容易就避免这个错误。

不完整的数据

根据下面的地图你能得知这里的哪个公司拥有较多的市场份额吗?(利用图表生成器)

数据可视化

仅根据上面的地图,你一定会认为‘ABC’拥有更高的市场份额。但在这里正确的答案是——‘它是不完整的信息’。原因是:我们肯定知道ABC领先的州的数量比XYZ多,但是我们不知道这两种产品在每个州的销售额。

如果ABC是所有小市场的领先者,XYZ是所有大市场的领先者,将会怎样呢?这样在这个国家XYZ的销售额整体上将会很高,即使它领先的州的数量相对较少。所以想要知道谁拥有更大的市场份额,我们需要更多的数据。

难以比较

假设你是一位企业主,你的业务有全球影响力。你想要比较你的公司在不同国家的市场份额,用这个图表如何?

数据可视化

数据可视化就是要使解读数据更加简单而不是困难。但是,上述图表使得读者很难去比较。难道你不认为下面的图表有着更好的效果吗?

数据可视化


如果在做图表时你能从读者的角度思考的话,那么你可以避免一些这样或者其他类似的错误。或者在出版之前努力从你的同事或者朋友那里获得反馈,问他们该图表是否能轻易读懂?是否可以很容易地对比两个图表?如有需要也可以使用标签。上面的饼状图没有使用数据标签,但是堆叠柱状图有清晰的标签。
资源

数据可视化是一个广阔的领域,如果你在阅读这篇文章,那么意味着你想在这方面做得更好。所以,现在你已经知道了一些常见的错误,这里有一些可以帮助你提高的资源。

· 获得良好的基础:定期关注图表库的更新并了解每个表格的制作方法。“制图基础知识”和“动态数据”都是一些很好的资源。
· 使用正确的工具:使用正确的工具会使你的任务变得更加容易,因为它们的设计目的就是防止一些小错误发生。
· 避免错误:你可以犯你自己的错误,或者从别人的错误中学习。随时从Junk Charts 和 WTFViz学习保持并更新别人犯的错误。

责任编辑:李英杰 来源: 36大数据
相关推荐

2024-07-01 08:51:19

可视化数据分析漏斗

2017-07-18 15:15:57

数据可视化细节层次分析

2017-07-13 09:21:05

大数据数据可视化

2024-03-25 14:17:52

数据可视化数据驱动

2020-03-11 14:39:26

数据可视化地图可视化地理信息

2017-09-12 10:20:00

大数据数据可视化错误及方法

2016-02-26 10:20:17

HadoopSpark大数据项目

2021-04-26 08:00:00

DevSecOps安全开发

2017-10-14 13:54:26

数据可视化数据信息可视化

2018-11-26 18:45:22

数据可视化绘图可视化

2019-09-12 09:00:32

数据可视化热图数据集

2019-03-08 08:40:06

物联网安全物联网IOT

2015-10-12 17:17:50

用户体验设计错误

2023-08-01 16:01:59

可视化Seaborn

2018-03-15 09:57:00

PythonMatplotlib数据可视化

2022-09-08 16:28:53

Python数据可视化机器学习

2017-02-23 09:42:53

大数据数据可视化技术误区

2015-08-26 13:49:06

可视化

2022-10-19 23:18:27

KubernetesPod错误

2015-07-29 10:46:20

Java错误
点赞
收藏

51CTO技术栈公众号