大家好,我是爱学习的小xiong熊妹。
今天继续更新九大数据分析方法系列。在工作中,我们经常会问:
- 下雨和业绩下降有多大关系?
- 销售上涨和新品上市有多大关系?
- 营销投入与业绩产出有多大关系?
这些问题,都有一个基础分析方法有关:相关分析法。
一、什么叫“相关”
简单来说,相关就是两个事件之间有关系。比如:
广告投入与销售业绩
下雨刮风和门店人流
用户点击和消费行为
即使没有做分析,直观上看这些事件之间也有关系。但是不做分析的话,具体是啥样的关系,很难说清楚。而相关分析,就是找出这种关系的办法。
二、什么是“相关分析”
相关分析,特指:找到两个数据指标之间的相关关系。
比如一个APP里,用户反复浏览一款商品,所以他会买吗?
- 一派认为:看的多,说明用户感兴趣,所以会买
- 另一派认为:看了这么久都不买,那肯定不会买了
- 还有一派认为:看多少次跟买不买没关系,得看有没有活动
听听似乎都有理,最后还是得数据说话。这里讨论的,就是:用户浏览行为与消费行为之间,是否有关系的问题。相关分析,即要找出这两个指标之间的关系。
三、直接相关关系
注意:指标之间可能天生存在相关关系。
常见的有三种形态:
- 在结构分析法中,整体指标与部分指标之间关系
- 在指标拆解法中,主指标与子指标之间的关系
- 在漏斗分析法中,前后步骤指标之间的关系
(如下图所示)
这三种情况,称为:直接相关。直接相关不需要数据计算,通过指标梳理就能看清楚关系。
直接相关的情况下,两个指标出现同时上涨/下跌的趋势,是很好理解的。比如:
- 整个公司业绩都不好,所以A分公司业绩也很差(结构分析)
- 客户数太少了,所以整体业绩不好(主指标、子指标)
- 看到广告人数太少了,所以最后转化不好(前后步骤)
如果直接相关的两个指标没有同涨同跌,往往意味着问题。比如做用户增长,注册的新用户数量大涨,但付费转化率持续大幅度下跌,这就说明获客效率在下降,可能是目标用户已耗尽,也有可能是渠道在造假,也有可能是获客方法有误,总之要深入分析(如下图)
四、间接相关关系
有些指标并非直接相关,但理论上是有关系的。比如品牌广告与销售收入,理论上肯定是存在关系:广告多了,知名度高了,销量肯定好。
但是品牌广告又没有带货链接,不能直接说:有5000万的销售业绩是用户通过广告链接购买的。此时就是典型的间接相关关系(如下图)。
分析间接相关关系,有2种常用方法,一种是散点图法,可以直接做散点图,发现相关关系(如下图所示)
另一种是计算相关系数。这里先不讲相关系数具体公式,小伙伴们只要记得excel里对应的操作即可(如下图)
计算出可以发现,广告投入与销售两个指标之间,确有相关关系。至于具体是怎么相关的,可以再做进一步研究。
间接相关关系,经常用来找改进业绩的措施。比如互联网行业里著名的“魔法数字”法,本质就是找用户浏览、点赞、分享、登录等行为,与用户留存、付费行为之间的相关关系。
如果发现:当用户点赞4次以后,用户的90天留存会明显增高。那么就把这个“4次留存”称为魔法数字,然后努力推动用户完成4次点赞。
五、相关分析的不足之处
世界上没有完美的分析方法,相关分析有两大不足之处。
不足一:相关不等于因果。
两个指标相关关系,本质上只是一条数据公式计算出来的结果,至于两个指标为啥相关?不能直接从计算里得结论。实际上只要两个指标走势相似,在计算的时候就能显示出相关关系。
这里有一个经典例子,下图是我在小区里种的一棵树的高度,与我国GDP之间的相关分析。大家会发现:哇塞!这俩指标完美相关哦!那么我种的这颗树就是我国的龙脉,能保佑我国经济腾飞咯?——当然不是!这就是相关不等于因果的直接体现。
不足二:相关分析不能解决非量化指标问题。
很多时候,我们想找的关系不能用数据量化。比如我们想知道:旗舰店是不是比社区店更能吸引消费者。一个店是不是旗舰,取决于位置、装修、宣传等诸多因素,不能粗暴的用开店面积、员工人数等指标来代替。
想分析这种非量化特征与指标之间的关系,需要用到另一种分析方法:标签分析法。