一个公司如果开始要做大数据,成本是需要考虑的:
1、机器。会比传统的业务更消耗服务器,单机配置一般也比较高。
2、人员。BI,分析师,应用研发,架构,算法,每种类型的人价格都不便宜
3、数据为导向(或者慢慢转换为以数据为导向)会对原有的产品产生额外的负担。比如大量的日志输出,上报等等
在实际的发展过程中,有很多老总敏锐的感觉到,手头有这么多有价值的数据,一定要利用起来,但是有几个问题确实是很多人不清楚的。很多都是边做边感受。有时候做到后面,心里也会犯嘀咕,花了这么多钱,这么多人手,做这件事情真的值得么?
我觉得真要做,至少要考虑下面几点:
1、需要多少成本?
2、需要多少时间?
3、产出是什么?
4、数据***呈现的产品形态是什么?
而最重要的是3,4两点: 大数据到底可以给公司带来什么?
首先我们看看大数据包含了哪些,然后我们再来阐述构建好平台后,大数据以什么样的产品形态产出。
1、数据本身
2、流水线(支撑数据分析的数据处理平台)
3、挖掘加工(分析数据内部特征关联性规律,也就是机器学习)
4、产品
目前产品呈现形态,我所知的有:
推荐
- 电商应用最广泛。有效增加用户体验,同时提升点击转化购买率
- 有内容产出的站点。比如CSDN
- 做内容聚合的,比如今日头条。据说今日头条的算法随着用户使用的积累,效果越来越好了。
广告(精准营销)
- 专业的广告公司,比如广告联盟.
- 特定产品本身承载的广告投放。比如微信那个高大上的朋友圈广告
- 公司内部的EDM,电话,短信等营销
搜索(排序因子)
- 机器学习产生的很多中间结果可以有效的提升搜索的排序
用户分析(这个算是)
- 了解你的客户是根本
- 金融行业非常依赖于此。比如信征,反作弊,反欺诈等。未来放贷的变革估计也靠此了。
- 这个可以作为一个直接的产品,也可以作为一个中间服务,直接支撑推荐,广告,搜索等产品
- 基于此还可可以有非常多的产品,就等待人们去挖掘了。
实时计算(流量计费,反欺诈/作弊等等都需要依赖于此)
BI报表
- 基础流量,你网站的pv,uv等等
- 质量监控,监控分析你的服务是否顺畅,比如视频播放卡顿比可以反馈出视频网站的服务质量。
- 运营监控,譬如通过情感分析可以得到用户的直观反馈。典型如京东评论的情感分析。
- 特定指标计算,这个是根据运营以及决策人员根据实际经验想看到的一些数据,我们把它量化,指标化,从而呈现出报表形态,方便运营以及决策人员做出相应的调整。
运维支持
- 也可以划归到BI报表中的质量监控中去
- 单独划归出来其实想说,大数据其实是可以对整个产品线的各个环节做support的。并不一定是我上面的列举。
上面说了七点,其实总结下,无非做了如下两件事情:
了解:
- 了解自己的产品
- 了解自己的用户
提升:
- 提升各种转化率
- 提升决策的准确率
当然,还有专门做数据的公司,只要他们能够为其他公司提供【了解】【提升】这两件事情,也就算达到自己的使命了。