九种常用数据分析方法!

大数据 数据分析
9种最常用数据分析方法,解决90%分析难题!

​01 关联分析 

关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。

关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。

图片

关联分析需要考虑的常见指标:

  • 支持度:指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。
  • 置信度:指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。
  • 提升度:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值。

02  对比分析 

对比法就是用两组或两组以上的数据进行比较。对比法是一种挖掘数据规律的思维,能够和任何技巧结合,一次合格的分析一定要用到N次对比。

对比主要分为以下几种:

  • 横向对比:同一层级不同对象比较,如江苏不同市茅台销售情况。
  • 纵向对比:同一对象不同层级比较,如江苏南京2021年各月份茅台销售情况。
  • 目标对比:常见于目标管理,如完成率等。
  • 时间对比:如同比、环比、月销售情况等,很多地方都会用到时间对比。

图片

03  聚类分析 

聚类分析属于探索性的数据分析方法。从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。

在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。

以最为常见的K-means为例,可以看到,数据可以被分到黄蓝绿三个不同的簇(cluster)中,每个簇有其特有的性质。

图片

04  留存分析 

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

按照不同周期,留存率分为三类:

第一种是日留存,日留存又可以细分为以下几种:

  • 次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;
  • 第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;
  • 第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;
  • 第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;
  • 第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。

第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。

留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。

下面以月留存为例生成的月用户留存曲线:

图片

05  帕累托分析 

帕累托法则,源于经典的二八法则——“世界上80%的财富掌握在20%的富人手里”。而在数据分析中,这句话可以理解为20%的数据产生了80%的效果,需要围绕找到的20%有效数据进行挖掘,使之产生更大的效果。

图片

比如一个商超进行产品分析的时候,就可以对每个商品的利润进行排序,找到前20%的产品,那这些产品就是能够带来较多价值的商品,可以再通过组合销售、降价销售等手段,进一步激发其带来的收益回报。

帕累托法则一般会用在产品分类上,此时就表现为ABC分类。常见的做法是将产品SKU作为维度,并将对应销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算累计销售额占比。

百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。

图片

按照A、B、C分组对产品进行了分类,根据产品的效益分为了三个等级,这样就可以针对性投放不同程度的资源,来产出最优的效益。

06  象限分析 

象限法是通过对两种及以上维度的划分,运用坐标的方式,人工对数据进行划分,从而传递数据价值,将之转变为策略。象限法是一种策略驱动的思维,常应用在产品分析、市场分析、客户管理、商品管理等场景,像RFM模型、波士顿矩阵都是象限法思维。

下面这个RFM模型就是利用象限法,将用户分为8个不同的层级,从而对不同用户制定不同的营销策略。

图片

象限法的优势:

(1)找到问题的共性原因

通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

(2)建立分组优化策略

针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

07 ABtest 

A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。

A/Btest的流程如下:

  1. 现状分析并建立假设​:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了。
  2. 设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。
  3. 设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。
  4. 分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。
  5. 采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。
  6. 最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。

08  漏斗分析 

漏斗思维本质上是一种流程思路,在确定好关键节点之后,计算节点之间的转化率。这个思路同样适用于很多地方,像电商的用户购买路径分析、app的注册转化率等等。

图片


上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。

整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

著名的海盗模型AARRR模型就是以漏斗模型作为基础的,从获客、激活、留存、变现、自传播五个关键节点,分析不同节点之间的转化率,找到能够提升的环节,采取措施。

图片

09  路径分析

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。

如何进行用户行为路径分析?

  1. 计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。
  2. 查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。
  3. 进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。
  4. 通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。
  5. 对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

图片

责任编辑:华轩 来源: 谈数据
相关推荐

2017-09-21 13:04:35

数据挖掘分析分析方法数据分析师

2020-12-22 15:33:42

数据分析技术IT

2021-10-27 19:31:37

数据分析Mece

2022-08-26 16:21:47

数据分析工具运营

2021-09-09 17:38:55

数据分析矩阵

2021-10-26 00:00:53

数据分析指标

2021-09-26 18:38:36

数据分析DEA

2020-10-25 08:56:31

数据分析数据大数据

2021-11-16 11:49:07

数据分析应用

2021-10-19 17:52:56

数据分析标签

2020-08-10 06:16:26

seaborn数据分析图表

2022-03-15 12:27:57

数据分析工具技能

2019-01-16 18:39:24

数据开发模型

2017-09-05 17:16:18

多维数据分析

2023-11-26 17:47:00

数据分析

2020-12-08 10:27:04

数据分析技术IT

2020-07-14 08:48:07

数据分析技术IT

2011-07-03 19:58:34

SEO

2021-09-07 11:14:36

数据分析互联网

2010-10-08 10:45:15

常用mysql命令
点赞
收藏

51CTO技术栈公众号