做数据的同学们,最怕被人喷:“你做的没有用!”
十个“你做的没有用”,至少七个和期望值过高有关
特别是越不懂数据原理的人,对数据的期望值越高
悲剧就是这么来的。怎么破?
问题场景:
某零售企业开始互联网转型,已上线微商城,并配套建设CDP,对微信端用户信息有一点采集(仅限于用户ID+购物行为+七零八落的互动行为)。现在负责微商城的领导找到数据分析师,表示:我们啥都有了,就差一个高深莫测的分析了,希望你能做出有价值的用户画像模型来提升业务。
问题1:听了以下五位领导的发言,你觉得他们“不懂数据”的程度排序是……A:我们啥都有了,就差一个高级建模了
B:你要做人工智能大数据分析下用户画像模型
C:我们日常的商城报表来来回回就那几个数,也看不出来啥
D:微商城的留存效果不好,用户复购低,得分析下问题
E:比如,买过护肤品的用户,可以看她多久能复购一次
思
考
一
分
钟
什么算不懂数据
拜各路网络文章、网络课程所赐,现在一提起数据,新人们满脑子都是:excel,sql,python,tableau,hadoop,spark,sklearn,tensorflow,那么既然这五位领导一行代码都不会写,那么答案就应该是:A=B=C=D=E=0咯,只有我才是精通数据的大神……
或者还有些新人认为:模型最牛逼,那肯定提模型的领导最牛逼了。所以是B≥A≥D≥C≥E,领导都说了要大数据人工智能用户画像模型了,看我不模他个天翻地覆……
大错特错
生产数据是数据部门的事,但应用数据是每个部门的事,甚至很多资深的业务,要比每天跑数的表哥更懂数据的含义和用处。所以从一开始,就不能拿技术能力去要求业务部门,而是得看这些人懂不懂如何用数据。
应用数据最大的瓶颈,当然不是建模,而是采集数据。没有好的数据质量,一切分析建模都是扯淡。而数据质量又和业务流程、建设时间、投入力度息息相关。如果业务方总急着上马新功能,不认真做埋点,不认真清理数据,那数据就是一坨屎。
一大坨屎也很大,但是它还是屎,变不成米饭,这是基础常识。没有数据,无法分析,这也是常识。
因此不要听业务方吹什么“我的数据很大,都在那了”,他如果不了解到底手头有什么数据,说的分析思路基本都是屁话。
所以真正能考察业务方到底懂多少数据的,是看他对已采集的字段了解多少,他对数据指标关注多少,对数据指标背后的问题思考多少。
- 了解字段的≥了解指标的
- 了解指标的≥了解数据问题的
- 了解数据问题的≥了解业务问题的
- 了解业务问题的≥“就差一个用户画像模型了”
- 所以这一题的真在答案是:E≥D≥C≥B≥A
如果你面对的领导/客户/同事,对自己的系统到底有什么字段,什么指标毫不清楚,却很希望你建立用户画像,精准预测模型,那可得小心了!这跟指望你炼救命仙丹没啥区别。
就比如本场景里,虽然名义上是微商城,可真实采集到的数据只有用户ID+交易行为,这跟线下门店的数据没啥区别,稍微复杂一点的模型都建不了,用户特征更是无从谈起。这时候反而E领导提的,基于某些交易行为做预测,还有一定可行性,面对其他几位,降低期望值才是正道。
问题一答完了,来问题二
问题2:听了以下五位领导的发言,你觉得他们“期望太高”的程度排序是……A:要是数据分析做的好,肯定业绩蹭蹭蹭
B:有了用户画像模型就能精准营销,极大提高用户购买率
C:至少得分析出来一些,我不知道,但是很重要的问题
D:用户复购原因,得分析的很深入,搞清楚
E:先把复购周期算出来看看
思
考
一
分
钟
估计不思考,也能看出来E的期望值是最低的,那么问题是,ABCD四位的要求算不算高?数据驱动业务,数据就是生产力不是人们都挂在嘴边上的吗?
什么算期望太高
首先,数据驱动业务,这句话本身没有错。
但是主语是:老板用数据驱动业务。作为一个用户,你永远不可能为了某个公司的某个程序员敲出来的代码买单,你只会在一个具体的时间、一个具体的地点,以一个具体的价格,买一个具体的商品,满足一种具体的需求。
因此数据想要发挥作用,就得结合宣传渠道,产品配置,价格定位,推广方式,这些需要一个系统化运作,而不是一个程序员敲几行代码。所以,所有指望敲几行代码就能业绩飞涨的行为,都算期望值高,而且是不切实际的高。
其次,没有数据能不能分析问题。
答:能,绝对能。实际上数据是分析问题最缓慢的手段,你还得采集数据,得清理,得存储,得计算。春江水暖鸭先知,在业务一线的人始终能更快速、更细致的感受到问题,并且依据经验、洞察力、测试等手段找到一些答案。
所以,指望数据分析,分析出来业务完全不知道且重要的问题,是非常不现实的。如果真是这样,只能说明公司的业务都是蠢猪,那这些蠢猪采集回来的数据自然也不能信咯。
再次,数据能分析出多少原因?
答:主观类原因都几乎分析不出来。本身人的行为和内心想法就不太一致,经常有口是心非或者欲扬先抑一类做法,目前数据无法记录人内心,只通过行为反推很有缺陷。
其次,用户行为经常分散在各个平台,单一平台记录数据不全,因此除了投诉、退货、参与团购、登记缺货、付款预约这种指向性明显行为外,其他行为也很难指向某个内心想法。所以在分析原因的时候,很有可能只能落到某个事件、某个行为上,真正的原因很难得出来。
所以综上,本体答案是A≥B≥C≥D≥E。同学们可以简单记住如下难度顺序:
- 直接提升业绩≥提能提升业绩的建议
- 提能提升业绩的建议≥精准预测走势
- 精准预测走势≥深入分析问题原因
- 深入分析问题原因≥评估问题状况
- 评估问题状况≥了解现状