数据分析是互联网产品极其重要的一个环节,目前整个互联网行业的发展逐渐趋于理性了,从好些年前的“增量市场”变为“存量市场”,很大的一个特征就是获客成本变高了,流量越来越珍贵。在这种行业背景下,数据分析成为了一手利器,可以推动产品设计与运营环节,列举几个典型的场景:
- 产品经理在规划新版本时,如何制定相关的数据指标来验证?
- 功能上线后,如何就采集到的数据,进行数据复盘,判断新功能是否达到团队预期?
- 如何通过数据了解产品目前的问题以及分析背后的原因?
- 运营人员在完成一个活动后,如何通过数据来评估本次活动的效果?
- 如何将冰冷的数据通过直观的可视化图表向上级进行汇报?
- 在产品设计的时候涉及到数据可视化统计的界面,如何选择核心指标以及合适的可视化图表?
- ........
以上只是数据分析应用的其中一部分场景,实际上还有很多。有些人可能会认为,数据分析那是数据产品经理的职责,其实不然,我认为数据分析重在思维,是一种通过现象看本质的思维,这种思维能力是产品经理需要掌握的,不少企业在招聘产品经理的时候也会看重产品经理的数据驱动能力。
数据本身冰冷没有意义的,我们需要通可视化图表将数据直观的表现出来,然后对其进行分析,发现背后蕴藏的规律。
数据可视化图表的类型十分丰富,此处不一一列举,本篇文章主要跟大家分享几种比较简单、常见的数据分析可视化图表以及使用场景。如果简单的图表可以解决问题,为什么还要花里胡哨呢?
一、常用的可视化图表
常用的可视化图表包括:饼图、柱形图、条形图、折线图、散点图,这五类图表可以满足我们工作中大部分的数据展现与分析需求,简单的图表往往能够有效、形象、快速地传达信息。
这时候你再回想一下,你在日常工作中见到的图表是不是基本上都是以下几种类型。
基本的可视化图表(图来自《谁说菜鸟不懂数据分析》)
以上五类图表是最为基本的可视化图表,它们还能够衍生出其他稍微复杂些的图表,比如柱形图还包括簇状柱形图、堆积柱形图、百分比柱形图。
EXCEL表对以上图表进行了比较好的分类与归纳,有兴趣做进一步了解的朋友可以打开你的EXCEL表,在插入图表功能中可以看到。
二、通过数据间的关系选择图表
常见的数据关系包括:成分、排序、时间序列、频率分布、相关性、多重数据比较。
1.成分(整体的一部分)
成分也称构成,主要关注每个部分占整体的百分比关系。适用的图表有饼图、柱形图、条形图、瀑布图。
1)饼图
如果仅需要关注单个整体的各部分比例构成,则首选饼图。饼图的分类不建议超过9个,可以把剩余次要的部分归类到“其它”项中。
饼图在数据分析中是比较常用的一种图表,比如用户来源渠道占比、各终端GMV贡献占比等都可以使用饼图。
2)柱形图
当需要对比多个项目之间的成分构成,且项目的个数不多时,我们可以用百分比堆积柱形图。
通过上图,我们纵向看出六大地区的销售额构成,也可以横向做对比。
为什么不继续使用饼状图呢?大家可以想象一下,如果我使用6个饼状图来向你传达6个地区按客户类型销售额占比,你还有那个耐心看下去吗?
3)条形图
其实条形图跟柱形图两者最主要的差异并不在于统计分析,而是在于数据展示的可读性。
当项目个数较多,名称较长时,可优先选择条形图,因为条形图能够横向布局,方便展示较长的项目名称。
在产品设计中,横向布局的条形图更能节省页面空间,且可以通过适当加大横坐标的长度来体现类目之间的差异性,这也是考虑使用条形图的一个场景。
所以,当需要对比多个项目之间的成分构成,且项目的个数比较多,项目名称较长时,可以用百分比堆积条形图来表示部分与整体之间的组成关系。
某校教师对学生在各方面表现的评价情况
关于瀑布图,我就不在这里展开介绍了,我自己使用的比较少,有兴趣的朋友可以自行百度了解。
2.对比(项目间的数据比较)
指不同项目间数据的比较。在对比的过程中会遇到如何排序问题,可以根据数值大小升序或者降序,也可以根据分析的主题来考虑使用什么排序。适用的图表主要有柱形图、条形图。
1)普通柱形图、条形图
当对比的项目由单一成分构成时,使用普通的柱形图或者条形图即可,比如销售额按地域进行对比、销量按商品品类进行对比、Top排序等。
普通柱形图
普通条形图
2)堆积柱形图、堆积条形图
当对比的项目由多个部分构成时,可使用堆积柱形图或者堆积条形图。可以比较清楚的看出各个项目的总数值大小以各项目内部的构成。
堆积柱形图
堆积条形图
3.时间序列(走势、趋势)
时间序列用于表示某事物按一定的时间顺序发展的趋势、走势,是上涨、下降、上下浮动还是基本稳定。适用的图表有折线图、柱形图、面积图。
1)折线图
折线图是最常用的表达事物随时间发展趋势的可视化图表,当时间序列的时间点比较多时,建议使用折线图。
如果大家有留意新冠疫情的动态统计,就会发现大家都是用折线图来展示疫情的发展趋势,我们通过一条曲线就可以很直观地了解疫情的动态。
下面举一个某小程序近30天变化趋势展示。
某小程序GMV近30天变化趋势
2)柱形图
有些人可能问到,折线图跟柱形图都能够表达时间序列的发展趋势,那什么情况下可以使用柱形图呢?
普通柱形图:一般情况下,如果时间序列的点比较少,且统计的指标由单一成分构成时,可以使用普通的柱形图。
堆积柱形图:如果时间序列的点比较少,且统计的指标由多个部分构成时,使用堆积柱形图会更为直观些。
某平台过去7天活跃用户数趋势
从上图你可以看出,活跃用户在8月15号达到最大值,随后大幅度下降,呈现出比较稳定的趋势。同时,你可以看出每天的活跃用户构成情况,三大运营商的用户数没有比较大的差异。
3)面积图
当然,我们也可以用面积图来表示时间序列的发展趋势。面积图其实是折线图的演变,折线图下方填充阴影,就构成了面积图。
普通面积图:当统计的指标是由单个成分组成的时候,可以使用普通面积图。
但是面积图有个缺点,就是当数据指标大于1个时,各数据指标之间可能会出现相互遮挡的情况,会影响趋势的展示,建议统计的指标类型不要太多。
由普通折线图演变而来的面积图
堆积面积图:当统计的指标是由多个部分构成的时候,可以使用堆积面积图。
下图表示某物流平台在第一大区(由四个重点地区组成)近四年的收入趋势。
堆积面积图
再比如,下图表示的是8月15到8月21号某电商平台的订单总量,(共10个品类,现统计其中3个品类)的变化趋势。
堆积面积图
在介绍上面几种可视化图表时,多次提到了堆积类型的图表,包括堆积柱形图、堆积条形图、堆积面积图,它们都是由多个部分累加得来的,最后组成一个整体。
以上图为例,2015年第一大区的总收入是39,分别由中山、东莞、广州、深圳在2015年的收入累计组成。
4.频率分布
频率分布可以比较清楚显示各组频次分布情况与差别。
当然,这一类比较也可以用频数分布表示,只是单位不同。比较典型的案例有班级学生的身高分布情况。适用的图表有柱形图、条形图、折线图。
利用频率分布,可以帮助我们对某些产品数据进行分析,比如统计用户在某一天内进行详情页浏览的次数分布、统计过去7天用户的购买频次分布情况。
1)柱形图
柱形图是比较常见的表示频率分布的图表,一般情况下,当表示分组较少的频率分布时,可以考虑使用柱形图。
某平台过去7天用户的购买频次分布
2)条形图
如果分组比较多、名称较长的,可以考虑使用条形图。
3)折线图
折线图也可以用于表示频率分布,如果分组比较多,希望看到数据的波动情况,可以选择折线图。
5.相关性
相关性用于衡量X与Y的关系,比如销量与价格之间的关系、访问量与浏览量的关系等。
最为常用的图表有散点图、气泡图。另外对称条形图、柱形图也可表示相关性,不过感觉见得比较少,所以在这里不做介绍,有兴趣的朋友可自行了解。
1)散点图
散点图表示因变量随自变量而变化的大致趋势,通过散点图,我们还可以看出各个点在坐标轴上的分布情况。
当只有两个变量X跟Y时,可用散点图观察两个变量之间的关系。
从上图可以看出,转化率和综合浏览量两者之间是呈正相关的关系。
2)气泡图
散点图一般研究的是两个变量之间的关系,但有时候我们的分析需要涉及到第三个变量,气泡图就是在散点图的基础上衍生而来的,用来表示三个变量之间的关系。
当存在第三变量,即X、Y、Z时,我们可以使用气泡图进行分析,点的大小或者颜色可以定义为第三个变量。
如上图,用圆点大小来表示访问次数的多少,可以看到访问次数最多的那天(最大的圆点区域),转化率和平均综合浏览量都不高。
6.多重数据对比
多重数据对比指数据类多于2个,且每个数据类拥有多个维度的数据分析比较。我们可以用雷达图来表示。
如下图,比较中兴Grand S 与索尼L36h 两款产品分别在牌照、硬件、价格、屏幕、系统5个维度中的评分情况。
最后,呈上一张总结图
常用图表类型与作用(来自《谁说菜鸟不懂数据分析》)
三、写在最后
数据图表远远不止本篇文章提到的那些,以上是基于自己的经验以及网上的资料总结而来,主要的目的在于帮助大家了解常用的图表以及如何选择合适的图表,如有纰漏的地方,敬请指出。
数据分析的目的在于发现问题、解决问题,需要根据分析的主题、数据之间的关系选择合适的图表,如果简单的图表可以解决问题,实在没有必要执着于复杂,常人不易理解的可视化图表。