做数据十年,第一次见这么棒的数据分析方法

大数据 数据分析
想真正理解&掌握数据分析方法,当然不能这样“拿着锤子找钉”。工作中的数据分析,要紧密结合业务,服务业务需求。因此理解业务需求,围绕问题找答案,才能理解各种数据分析方法有什么用,该怎么用。

很多同学会困惑:到底什么才是数据分析方法?因为网上对于数据分析方法的描述,有些抄袭自营销学书本,比如4P、PEST;有些则抄袭自统计学书本,比如相关分析,回归分析。可真到做分析的时候就傻眼了:眼前的问题到底该P一下还是回归一下?

想真正理解&掌握数据分析方法,当然不能这样“拿着锤子找钉”。工作中的数据分析,要紧密结合业务,服务业务需求。因此理解业务需求,围绕问题找答案,才能理解各种数据分析方法有什么用,该怎么用。

6大类典型的业务需求

一个完整的业务活动,分为六个步骤:了解现状→设定目标→制定计划→监控走势→诊断问题→复盘结果。在每个阶段,业务掌握的信息,想解决的问题是不一样的,因此对数据的需求会不一样(如下图)。

图片图片

如果是从制定年度经营计划开始,数据分析师就参与到工作中,那么就会完整地经历这6个步骤。

但是,很多同学是中途入职/半道接手工作,最常见的是:

1、从监控开始,先输出日常报表,再发现问题

2、直接接到一个分析任务,就XX问题输出报告

3、事情已经做完了,事后补一份复盘报告

这个时候,很有可能数据分析师对业务都不熟悉,匆忙赶鸭子上架,肯定毫无思路了。此时,至少得把第1步:了解业务现状补齐,然后再对症下药。

了解现状的方法

了解现状阶段,更多是系统地呈现数据指标,让业务看清楚情况。数据指标体系本身有3种结构:并列式、流程式、总分式。有

一些常见的分析方法与这三种形式对应。比如:

  • 杜邦分析法对应总分式指标体系。主要用于评估经营情况好坏,拆解财务指标,监控业务行动结果。
  • UJM方法对应流程式指标体系。主要用于梳理用户行为路径(互联网企业使用的尤其多),看清楚用户转化方式。
  • RFM方法对应并列式指标体系,主要用于对用户消费行为进行分类,区分高中低消费+待唤醒的紧急程度。

(如下图)

图片图片

需要注意的是:单纯地展示指标并不能得出任何分析结论。至少要展示指标+不同个体间进行对比。

比如:

1、杜邦分析法:两个同行业公司进行比较

2、UJM方法:两个不同路径进行比较

3、RFM方法:两类用户群体间比较

因此,在了解现状阶段,不要光想着罗列一大堆指标出来,而是思考下:到底选取谁进行对比,才能更好发现业务之间差异性,从而启发业务部门思考。

设定目标的方法

在设定目标阶段,很有可能业务部门想了解:

1、如果不做任何改变,自然情况下业务会发展成啥样?

2、如果增加/减少某项资源投入,业务会发展成啥样?

3、如果改变一种业务做法,业务会发展成啥样?

此时就涉及到预测问题。预测自然发展趋势,一般会运用到时间序列法,根据数据走势的不同,有平滑法、自回归、季节性回归、带季节趋势的回归等方法可用。如果考虑改变资源投入,可以考虑带因果关系回归。因为投入产出之间一般都有函数关系,可以通过数据拟合投入产出曲线,从而模拟调整结果。

图片图片

如果要改变业务做法,则要先看:业务是否有采取同类措施。如果已有同类做法,则可以参考同类做法的投入产出情况进行推算。如果连做都没做过,那就得先做测试,不然没数据就是空拍脑袋。

需要注意的是:设定目标很多时候要体现领导想法,数据本身只是参考。所以很有可能在做完自然情况预测后,业务部门就会开始拍脑袋了。此时可能不需要复杂的分析方法,而是利用数据指标体系,拆解KPI指标,之后根据领导们的要求增减相关,模拟可能的结果。

制定计划的方法

在制定计划阶段,很有可能业务想把一个大目标拆解下去,落实到具体执行工作中。此时可以使用OGSM方法,这是一套标准的把定性目标落实为定量目标,把定量目标拆解为执行步骤,再监控执行的方法(如下图)。

图片图片

还有可能,业务想先不自己动手拆,而是看在现有投入产出水平下,理论最优解是什么。此时可以构建投入成本函数,利用本量利分析/线性规划方法,计算理论最优解,供业务参考(如下图)。

图片图片

同目标设定一样,做计划的时候,很有可能业务完全凭经验,自己估摸一个数字就开干了。过于粗糙的计划,会导致:执行安排不合理、临时调来调去、缺少后备方案,这些都会导致执行过程的问题。

数据分析师如果能提前了解情况,就能在下一步监控走势的时候轻松很多。

监控走势的方法

在监控走势阶段,核心任务是:观察业务是否在预期内发展,是否有异常波动。因此需要数据分析方法,判断业务是否正常。

此时有周期性分析法、投入产出分析、结构分析法、分层分析法、矩阵分析法五种方法可用。

  • 周期性分析法,是根据业务特点,拆解出业务发展随季节变化/生命周期变化/投入产出变化而产生的规律。通过和常规走势对比发现问题。
  • 投入产出分析,则是根据业务行动投入力度+过往数据经验,预判可能效果,如果排查:是否因本次业务执行不力,导致数据异常
  • 结构分析、分层分析、矩阵分析,则是通过多个业务之间对比,发现被平均数掩盖的问题。还有些常见的说法,比如ABC分类、二八分类,其实都是分层分析的特殊形态(如下图)

图片图片

在监控走势的时候,这些常规方法,完全可以和监控指标做到一起,做成同一张监控数据看板,在观察到主指标异常以后,直接从总体到具体查看数据情况,看看是哪个部分出了问题,从而极大提高发现问题的效率。

问题诊断的方法

在诊断问题过程中,是否有业务假设是最关键的。

1、如果业务啥都没有,那就只能构建分析逻辑树,层层排查问题

2、如果业务有一个明确假设,可以直接做排除法,验证假设是否成立

3、如果业务已经有应对方案,可以直接做实验,测试方案可行性

虽然一提起问题诊断,人们本能会想到:构建逻辑树。但构建完整的逻辑树太过费时费力,且很多假设需要收集外部数据检验,现实工作中不是时时刻刻都有这么充足的数据供应。因此诊断问题时,尽可能先找业务假设,快速输出结论。

图片图片

验证业务假设的时候,是否做实验是最关键的区别:

1、如果完全不能做实验,那么只能通过标杆分析(对比好/坏个体),过程诊断(分析业务过程中最拉胯的环节)来输出分析结论。

2、如果能做实验,但不能做抽样测试,那么只能做改进前后对比分析。

3、如果能做实验,且能做抽样测试,那么可以采用统计学方法,检验实验效果。

结果复盘的方法

如果前边5步做到位了,在结果复盘的时候就非常轻松:

1、对比目标、实际差距,下判断:到底做得好不好

2、调取过程监控数据,看执行过程中是否有问题

3、调取问题诊断数据,看问题发生原因及处理的结果

这样综合各项结果的复盘是非常全面的,即包含了结果陈述,又包含了经验总结。

很多同学觉得复盘特别麻烦,是因为没有参与到全流程的工作中,活动结束了才被指派任务要复盘。此时一不了解目标,二不了解过程,自然得从头到尾梳理一遍才能出结果。如果碰上业务自己都没有设定清晰的目标,没有监控过程数据,那就更两眼一抹黑了。

责任编辑:武晓燕 来源: 接地气的陈老师
相关推荐

2024-05-20 13:20:35

数据分析业务程序

2014-05-19 10:16:56

WinJS开源TypeScript

2019-09-09 09:17:58

数据总监职场

2011-07-21 21:01:37

诺基亚塞班苹果

2017-03-22 15:38:28

代码架构Java

2018-09-11 17:05:12

戴尔

2018-08-15 10:34:30

戴尔

2018-11-21 14:51:00

Windows 功能系统

2022-03-16 14:59:28

打包debian模板文件

2012-04-13 10:11:58

Windows 8泄露

2011-08-08 13:31:44

数据分析数据仓库

2023-09-11 00:14:46

后端团队项目

2018-05-17 10:57:38

数据科学实习学习

2022-07-11 11:28:45

数据分析业务消费

2020-03-12 18:56:06

MySQL主从复制数据库

2022-08-15 08:16:56

shiroWeb认证

2010-01-08 11:18:14

2011-03-31 13:11:50

WebLogic线下活动

2018-08-14 09:28:40

分布式事务 ACID

2013-05-13 11:35:53

独立开发开发经验开发感悟
点赞
收藏

51CTO技术栈公众号