通向优秀数据分析师的六个阶梯

大数据 数据分析
很多同学都在问:”数据分析从0到1的文章看多了,咋样才能从1到10,从普通到优秀呀!”今天系统地解答一下。“优秀”是一个形容词,只有清晰了参照物,才能知道到底什么是“普通”,什么是“优秀”。今天就从“普通”讲起,想通往“优秀”,需要迈过6个阶梯。

本文转载自微信公众号「接地气学堂」,作者接地气的陈老师。转载本文请联系接地气学堂公众号。

很多同学都在问:”数据分析从0到1的文章看多了,咋样才能从1到10,从普通到优秀呀!”今天系统地解答一下。“优秀”是一个形容词,只有清晰了参照物,才能知道到底什么是“普通”,什么是“优秀”。今天就从“普通”讲起,想通往“优秀”,需要迈过6个阶梯。

第一阶:搞数据

数据分析最怕啥?

没思路?

没模型?

没图表?

都不是!

数据分析最怕:没数据!无论是做啥分析,搞数据,始终是第一位的工作。尽可能多地搞数据,是第一位要求。不然一切免谈。

只不过,同数仓开发不同,数据分析关注的数据,是面向业务主题的。数据服务的产品、运营、销售、营销、售后部门,到底有什么数据,需要什么数据,是数据分析师必须梳理清楚的。

具体来说,包括:指标/维度两部分。如何衡量是否清晰?可以问自己,以下问题是否清楚。

1、我服务的部门是……

2、该部门属于利润中心/成本中心

3、该部门的KPI指标是……

4、该部门的主要流程是……

5、该部门流程中,已采集数据是……

6、该部门现有过程指标是……

7、该部门组织架构是……

8、该部门服务对象分类是……

9、该部门常用分类维度是……

其中:

1、2、3是用来明确主要KPI指标的,这是数据分析的源头和关键

4、5、6是用来搭建过程指标体系的,解释KPI指标如何达成

7、8、9是用来筛选关键分类维度的,当KPI指标波动,从这些维度做拆解

很多同学习惯于在现有宽表上跑数,向上不清楚业务流程、业务目标,向下不清楚数据来源、数据采集,每天忙着按需求单跑数,连跑的数是啥意思都不懂。这样就限制死了自己的发展空间,无法进一步提升能力了。

第二阶:定基线

做到第一阶,至少能看懂自己跑的数据了,知道每个数据是用在哪个部门,哪项工作。下一步最关键的是……?

有的同学可能不假思索地说:建模!还没到这一步哈。下一步关键的是:定基线。知道自己看的数据,常规形态是啥样的。知道什么算正常,什么算不正常。

这一步非常重要!因为数据本身没有含义,数据+标准才有含义。而并非所有指标,业务方都会给出标准的。很可能,只有销售数据才有具体到每天的考核标准,其他数据得凭经验、凭常识、凭分析定出基线(如下图)。

很多同学无法解读数据,做的分析不被业务认可,都是因为没有跨过这一台阶。最常见的,看到指标跌了,盲目做了一堆交叉,然后业务方轻飘飘地:“这是正常波动”。

然而第二天又有同样幅度波动,业务方却急着烟熏火燎:“这么大波动你都看不到吗!”……被这么折腾几次,就会信心全无,怀疑人生。所以想进步,就不能被业务方牵着鼻子走,得自己有定基线能力。

第三阶:拆因素

跨过第二阶后,数据分析师已经对业务常见走势,有充足的了解。并且,自己有能力做判断,就能识别出异常状态。并非所有的异常都不可控,有相当多的异常是可观测因素导致的,比如宏观环境,比如营销动作、推广计划。此时,要先有能力先把这些明显可识别的“白犀牛”整明白,再来谈其他“黑天鹅”问题。

看到这里,肯定有同学会说:“老师,这个简单,我的PEST,SWOT,4P已经按捺不住了,来吧!”然鹅,没卵用。你看那么多PEST的文章,有一篇教过你怎么量化P、E、S、T四个指标不???

所以这一台阶,叫“拆因素”,即把这些影响业务的因素,拆解到可以量化的,能用一个或几个数据指标表现,并能与内部数据结合分析的程度。拆因素可能有若干数据形态,比如:

1、0、1形态:有XX因素、没有XX因素2、分类形态:同一事件,A\B\C三种状态3、连续形态:能用一个连续型指标,代表该因素

具体怎么拆,是需要大量分析工作做基础的,最后能沉淀下来的,就是最有价值的经验。

第四阶:测细节

跨过第三阶段后,数据分析师能对明显的,重大的影响因素做出判断。想要进一步提升,就得深入到细节中,了解活动到底怎么做的,产品到底怎么设计的,用户到底需求什么。这些已经触及业务的核心,因此很难短时间内搞清楚,需要长期积累。

想做这一步,有2个关键工作要做。

其一:打标签。越是触及业务核心,连续型指标能描述的情况就越少,越需要打标签。类似用户情绪、喜好、产品功能点、营销逻辑,都是靠标签来描述和量化的。准确地打标签,将业务量化,做出清晰的分类,是高级数据分析师的技能。不是说把数据库里的,现有的维度表拖出来就完事。

其二:做实验。可能有同学会说:ABtest我现在也经常干,为啥感觉不到进步呢。注意,现在的ABtest,很多是产品驱动的,不是数据驱动的。鬼知道产品经理从哪里搞了2个版本,扔过来就测,然后让数据分析师解释差异。这是非常本末倒置的,只会让人陷在琐碎的数据里。

一个正式的实验,是:1、有清晰的改进目标2、有清晰的改进逻辑3、有关键改善过程指标4、有环境控制变量5、有组间差异预判

谋定而后动。这样才能在解读实验数据的时候剔除各种杂糅因素,得到正确结论。当然,想做到这一步,需要业务的配合和参与。如果业务真的很喜欢自说自话,就靠数据分析师个人能力,至少推动剔除一些明显容易杂糅的因素。

第五阶:理逻辑

迈过第四个台阶,数据分析师本人已经可以实现:描述问题-发现问题-解释问题-检验效果的闭环了。单纯站在数据角度,已经是个完整的能力闭环。

但仅有数据能力闭环是不够的,因为在企业里,相当多的问题不是来自技术,而是来自业务。更有甚者,是来自业务方的屁股决定脑袋,来自业务方急功近利、大干快上,来自业务方事前拍脑袋,事后拍大腿。

因此想要让数据更好地展现价值,就得有能力应对现实问题。在千头万绪中,梳理清楚问题逻辑,找到正确的答案,或者至少给自己找到脱身的办法(如下图)。

这时候“理逻辑”,重点是把口语表达的,不可量化的业务逻辑,转化成数据可验证的逻辑,并且选择合适的数据方法得出结论。除了数据能力,还需要数据分析师有业务洞察,有一些职场沟通技巧,才能完成任务。

第六阶:组模型

有了以上五个阶段的积累以后,你已经能完全在一个行业里混得如鱼得水了,不但能做好基础数据服务,也能协助业务做出业绩,更能以客观中立的态度赢得老板的信任。

此时,可以更进一步,提炼一些属于自己的模型出来:如果用少数关键指标就能概括这个行业的问题,可以捏个业务模型如果某个业务场景,用特征+算法能得到很准确的预测结果,就固定成该行业算法模型。搞完了,记得也取四个英文字母做名字以体现档次。

做这一步,不仅是为了沉淀经验,提升逼格,更是为了迁移知识,扩展使用范围服务的。很难保证人一辈子都不换行,掌握了优秀分析能力的人,干一行就是一行专家。而迁移知识,靠的是模型的总结与经验积累,两者缺一不可。

小结

纵观整个成长阶梯,核心就是:数据分析师要能剥丝抽茧的解决复杂企业问题,这样培养能力,才是我们自己安身立命的法宝。

很多在校的,刚毕业的同学们,还习惯于沉浸在书本中,总觉得越难的知识越牛逼,一本统计学有19章,那第19章肯定比18章牛逼……这样单纯堆叠知识点,可以无穷无尽卷下去,但是对于提升实际能力帮助甚小,非常不推荐哈。真有兴趣搞这些,推荐去纯科研。

特别是,数据分析本身就是一个面向不确定性,用数据方法解决企业经营不确定性的工种。把数据采集上来,服务好管理层,推动业务实现业绩,至少就有一个公司数据部门总监位置在召唤,合理而不为呢。与大家共勉!


责任编辑:武晓燕 来源: 接地气学堂
相关推荐

2023-03-02 11:51:00

数据分析师企业

2024-03-07 12:54:06

数据分析师企业

2022-02-07 14:00:27

数据分析模型

2021-07-19 10:06:30

数据治理数字化转型CIO

2019-10-12 14:47:58

Excel大数据数据库

2009-12-03 10:23:19

应用安全做法浅析Web2.0

2015-03-05 14:24:00

大数据分析大数据大数据分析工具

2015-09-08 10:05:50

数据分析素质优秀

2021-08-07 09:32:23

数据治理数字化转型CIO

2019-10-25 15:48:09

数据分析师IT技术人员数据科学

2015-08-18 13:26:05

数据分析

2012-08-08 09:00:29

数据分析师

2016-10-21 14:41:22

数据分析师大数据

2023-08-25 16:33:10

2020-07-24 00:41:18

物联网项目物联网IOT

2023-12-22 09:14:48

EDA数据分析探索性数据分析

2012-08-07 17:32:25

数据分析师

2017-02-13 19:25:24

2015-04-03 11:19:21

大数据大数据分析师

2013-07-29 15:58:28

大数据数据分析
点赞
收藏

51CTO技术栈公众号