总做描述性统计,深入的数据分析到底怎么做?

大数据 数据分析
很多同学做不深入,是因为从2级深度开始,就不能只指望几个指标/维度交叉一下,直接拉出结论来,就得结合业务场景,转化业务假设,然后搜集证据。这要求掌握业务场景、指标、逻辑能力。这些能力需要积累和锻炼才能提升。

0级深度

最简单的原因分析,就是单维度做个细分对比。比如分析为啥业绩没达标,细分一看,发现5个分公司,有2家没达标。那么分析结论就是:“因为2个分公司没达标,所以业绩没达标”搞掂!

图片图片

当然,这时候可以再多做一步:量化每个没达标的分公司的影响。比如看看谁是达标率很低的,谁是拖累大盘的。做到这一步,单维度的细分对比就做到头了。

图片图片

1级深度

既然单维度细分可以做,那多维度也能做。常见的,就是拉交叉表。比如业绩为啥没达标?把产品、用户、分公司等维度,都拉出来和业绩目标做个交叉,然后把每个维度有哪些差异一一列出来。很多同学做问题原因分析,其实都在干这个事……

图片图片

注意,这里可以多做一步,就是发现几个维度之间的联系。因为很有可能,A、C、E三个分公司卖不好,背后有同样原因:他们都是甲产品的主要销售地,而甲产品做烂了……这种联系,可以通过两个维度交叉对比发现。

图片图片

2级深度

然而事还没完,我们依然会追问:为啥甲产品会做烂?是这个产品先天性质量不过关,还是后期运营没有做到位?注意!到这一步,问题发生变化。不管是“先天质量不过关”还是“后期运营不到位”,都没法直接拿一个指标来衡量。此时,我们需要做转化,把语文描述的假设原因,转化成可量化,可验证的指标。

比如“先天质量不行”,这里有两个点:

1、什么叫质量

2、怎么算不行

衡量质量,可以从产品性能、配置等硬件角度(需要二手资料收集),也可以从用户体验、口碑等角度(需要调研/舆情数据采集),先把指标定下来。衡量“不行”则得找到参照物,可以参照自己的上一代产品,或竞争对手同期产品进行对比(如下图)

“后期运营不到位”,也是同理,可以进一步拆分。而且因为运营涉及了推广、促销、商品周转等好几个方面,所以得每个方面单独看数据:

1、推广质量如何(各推广渠道转化漏斗)?

2、促销力度如何(优惠力度/整体资源投入)?

3、商品周转如何(是否有渠道缺货/积压)?

图片图片

注意!当出现好几个方面的时候,有可能有第1级深度时候的问题:几个方面相互影响。此时由于假设不能用一个分类维度简单替代,所以检查相互影响的难度较大。一般来说,为了分析清楚,需要从业务逻辑角度,找“离用户近的,上游的”原因。比如推广、促销、商品周转三者相比,推广更上游,推广不行,人不够,啥都不行。所以可以先从推广上排查。

3级深度

我们在2级深度,确认了:

1、产品的包装不是很受消费者欢迎(前期调研没做好)

2、产品的价格偏贵,对手有更便宜的货

3、推广效果不理想,推广转化率未达预期

所以呢?分析结束了吗……

不一定,因为一个健壮的问题原因,得是:

有这个原因的时候,问题存在

没有这个原因的时候,问题消失

两边都成立,才能称之为“健壮”,因此如果只做到2级深度,领导经常会反问:“那是不是我换个包装/降个价/换个文案,它业绩就能好啊”说这话的同时,语气中好充满了不信任。

此时终结问题的最好办法,就是:真的安排一次测试。哪怕是先小范围的测试,确认能解决问题也行,后续推大规模测试。注意,三个问题里,包装问题相对难改,价格和推广是很容易改的,做测试的时候,一般会选择容易改的下手,尽快获得反馈。

图片图片

比如价格问题,可以就近找个节日,安排一次节日促销,动一下价格看看效果。这里有两个点要注意:

1、测试得可控,不能不留后手。比如调价,万一全面降价,商品销量还是没起色,咋办!不留后手,只会逼死自己。

2、测试要注意控制其他变量。比如测价格,肯定会通过渠道投广告,那渠道运营就不能太烂,至少拿一些之前表现相对好的渠道来做。不然又扯不清,到底渠道和价格各自影响多少。

这是企业里做测试,与实验室做测试的最大区别。实验室是封闭环境,可以耐心地做各种精细分组,一个个控制变量做对比。但企业环境下,很多问题前后有牵扯,内外有影响,要往着“出业绩”的方向努力。结果好,一切都好。不然磨磨唧唧试了几次都没提振业绩,估计自己都得滚蛋了。

4级深度

做到3级深度,很多同学会觉得:这下终于无死角了吧。其实还是有个潜在的问题,就是:短期和长期的矛盾。短期内的重点问题,不代表长期内也是重点问题。比如短期内促销一下就能拉起销量。可长期来看,上的促销越来越多,产品力越来越弱。最后经费烧尽,企业就完蛋了……

图片图片

因此,短期测试/验证的结果,需要长期累计的数据做支持,以评估长期效应。这样做数据逇时候,就不能“头疼医头,脚疼医脚”而是得做长期观测。把每一次遇到问题的假设列清单,记录下来,然后观察长期内:

1、是不是某些问题反复出现

2、是不是有些问题持续很长

3、是不是解决问题手段趋于单一

4、是不是解决问题成本越来越高

如果是,那就说明存在长期问题。

图片图片

此时,那些反复出现、长时间持续的问题,就可以成为突破口。虽然短期内它们不是重点,会被促销等掩盖,但长期存在本身就是问题,就得推动业务去解决它。

小结

很多同学做不深入,是因为从2级深度开始,就不能只指望几个指标/维度交叉一下,直接拉出结论来,就得结合业务场景,转化业务假设,然后搜集证据。这要求掌握业务场景、指标、逻辑能力。这些能力需要积累和锻炼才能提升。

而第3、4级深度,又依赖于业务配合。我们经常见到,有些公司的业务遇到问题,不是甩锅,就是粉饰太平,要么就是不分三七二十一搞打折促销,导致很多假设无法被验证,分析经验也无法积累。

这时候,就要求做数据的同学,自己有总结问题的能力,归纳业务到底干了啥。如果我们发现业务只会“三板斧”,发现一些持续性问题始终没人管,其实我们的洞察能力已经上了一个台阶。如果我们能再设计实验,验证假设。即使没有真的投产,也是宝贵的分析经验积累。这些经验能让我们在其他更规范的企业,发挥价值。

责任编辑:武晓燕 来源: 接地气的陈老师
相关推荐

2022-07-06 11:30:57

数据分析预测模型

2023-06-02 11:55:02

数据分析营销

2012-05-31 09:33:28

数据分析

2021-11-10 05:00:58

数据分析运营

2023-07-29 22:27:44

2024-03-14 11:46:44

数据分析师定价模型

2020-07-22 07:49:14

数据分析技术IT

2021-10-12 10:22:33

数据库架构技术

2023-05-26 07:50:17

数据分析师BI工具

2023-09-27 22:44:18

数据迁移数据库

2019-07-02 10:22:15

TCP流量数据

2022-07-11 11:28:45

数据分析业务消费

2015-08-14 14:29:00

数据分析

2020-05-15 15:09:51

R语言数据分析

2016-09-30 01:04:45

数据分析数据

2023-05-11 13:39:39

EDA数据分析

2020-07-28 08:36:54

数据安全数据泄露数据

2023-12-29 10:04:47

数据分析

2022-03-10 11:25:51

InnoDB优化

2016-01-05 16:17:59

云梦数据仓
点赞
收藏

51CTO技术栈公众号