究竟是靠大数据还是小数据来满足用户需求

企业动态
全球品牌顾问马丁·林斯特龙(Martin Lindstrom)认为,要是说这个时代的一百大创新中, 有大约百分之六十到六十五实际上是通过小数据而来,一点都不为过。

[[190801]]

介绍

要说起现如今的一个重大趋势,无疑是大数据的使用,换言之,在一堆被处理过后的统计数据中筛选并检测出人们的行为方式。在这篇文章里面,我将总结大数据的两面性—它是把双刃剑的原因,通过我们的实践经验来解释数字分析和用户行为跟踪带来的潜在实际应用。诚心希望以下的例子可以给你带来一些灵感,以便于你更好地设计一套有效的营销策略。

小数据、大数据的定义

大数据的关键在于寻找关联,但小数据则是寻找因果关系,也就是原因。小数据和大数据是有明显差异的,大数据通常指的是大量结构化和非结构化数据(单位可以是拍字节PB或者艾字节EB)。下面的表格是两者详细的比较。

大数据的特点通常被总结为3V: 数据的量(Volume of data),数据的多样性(Variety of data)以及数据被处理的速度(Velocity)。这三个特点结合起来使得管理大数据变得非常困难。

一个公司可能重投资在服务器的存储上,使用复杂的分析机械和数据挖掘,以便于网络中搜寻许多不同的数据,包括用户操作时的日期及时间、人口数据信息等等。所有的这些都可能导入到一个数据仓库,在这里,你通过复杂的算法对数据进行分类和处理,之后这些数据将呈现在一份份具体的报告里面。虽然以上过程在很大程度上给企业带来许多好处,但是很多企业也意识到这样操作非常的费劲,而且很多时候,即使是并不那么强大的数据挖掘策略也可以取得相同的结果。

大数据的价值

随着云时代的来临,大数据吸引了越来越多的关注。投入大数据的原因之一是公司希望应对不断波动的市场,从数据获取突破性的见解,让公司赚个盆满钵满。

亚马逊前任首席科学家Andreas Weigend说:“数据是新的石油。”一分钟内,微博推特上新发的数据量超过10万;社交网络“脸谱”的浏览量超过600万…这些数据都能干啥? 具体有两大价值:

1、了解大众情绪或心态:如果定下明显的指标,而且信息价值高,大数据可以提供预测导向。通过大数据分析大众情绪的好处是,大家在社交网络或者网络媒体上发言时,通常不会刻意隐瞒自己的观点,因此分析的准确性要比问卷调查好很多。例子包含华尔街根据民众情绪抛售股票和对冲基金依据购物网站的顾客评论,分析企业产品销售状况。

2、处理海量数据:如果各种指标之间的相关性是已知,大数据可以按照自定义规矩迅速连接句点。安泰保险(Aetna Inc.)为了帮助改善代谢综合症患者的预测,从千名患者中选择102个完成实验。在一个独立的实验室工作内,通过患者的一系列代谢综合症的检测试验结果,在连续三年内,扫描60万个化验结果和18万索赔事件。将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素和重点治疗方案。这样,医生可以通过食用他汀类药物及减重5磅等建议而减少未来10年内50%的发病率。

小数据的观点

然而,全球品牌顾问马丁·林斯特龙(Martin Lindstrom)(在“全球最具影响力50大商业思想家”(Thinkers 50)排行中,他位列第18名)在他的书 Small Data: The Tiny Clues that Uncover Huge Trends《小数据,大趋势》中写道,单单使用大数据来制定经营策略,是不太理智的, 因为它最多只提供一个 “人们想要什么”的数据快照,而且这个快照还是理想化的。

现在,很多企业渐渐从追逐最新兴技术的浪潮中退出来,因为很多时候它们往往更适用于比较复杂的业务流程。对于这些企业,小数据就是一个他们的新选择。Lindstrom认为,要是说这个时代的一百大创新中, 有大约百分之六十到六十五实际上是通过小数据而来的,一点都不为过。

问题是,当我们狂热于大数据的时候,我们就忘了创新力。大数据的关键是分析过去,但过去和未来是没有关联的。另一方面,Lindstrom将小数据定义为消费者家中那些似乎不重要的现象,比如可以是人们怎么摆放鞋子或者怎么悬挂家中的油画。这便是情绪基因──它可以帮助你先去定义你的假设,然后再开始挖掘这个假设并找寻关联。

Lindstrom分享了一个有趣的故事,这个故事讲述了他与宜家家居的创始人英格瓦尔·卡姆普拉德 (Ingvar Kamprad) 见面的场景,发生在一个斯德歌尔摩的宜家店铺。他发现Kamprad正坐在一个收银台后面,仔细地观察着周围的人。当Lindstrom 问道:“这样子是为了什么吗?”,Kampard答道:“之所以这么做,是因为这绝对是最实惠也是最有效的调查方式——我可以随时问他们为什么选这个,又为什么不选那个。”

关于小数据:两个出彩的实际应用

“大数据是无用的。因为大数据关乎的是巨大的数据集——将人们以各种各样的行为为标准进行分类。而对于大多数公司来说,它们的重点则是与顾客建立良好的关系。”

——Devin Wenig,eBay国际的总裁

在Wenig看来, 大多数公司并不希望进入一个大的数据集,特别是当顾客只是想要买件衬衫的时候。这种时候,关键问题恰恰是小数据——以一种无侵害性的方式采集用户行为,以便揭秘一些可能消费者自己都没有注意到的细节。

接下来,我们将根据Kamprad和 Wenig 的观察,总结三个小数据在实际生活中的应用。

1. 成为你智能手机里数据的主人,并好好利用它。

Lindstrom发觉,智能手机里隐藏着大量的信息,包括我们是谁、有什么梦想。就个人层面来说,每一次我们签到、搜索、浏览和发帖等等的时候,我们都在提供这些小数据,也同时创造了一个独特的记号,记录了网上和现实中的两个自己。

你的用户行为信息可以说是一个信息黑洞,亦或是一个信息金矿。至于你叫它什么, 就取决于你在数码方面有着多少准备了。如果你选择使用免费的分析方式,比如谷歌分析(Google Analytics),或者一个中国的类似产品友盟,你的数据就是产品,而谷歌分析会利用它去改善自己的Adwords产品。所以说,拥有大型的技术部署现如今仍旧是明智的选择,也能为小/大数据的应用提供一个坚实有力的基础。

2. 提高虚拟体验

eBay的总裁Devin Wenig之前说他认为网上购物是非常实用的,同时也很鼓舞人心。零售业的未来“下一波”将激起灵感和想象,并复制实体店所能提供的体验。“我本来去商店买一条裤子,最后不但买了裤子,还带回了一件搭配和谐的衬衫。”

小数据就是Wenig对未来想象的核心:我们从末端用户开始——他们需要什么以及他们如何行动。先聚焦在他们身上,那么之后我们很多的技术决定也就变得十分明了了。

建立一个全面的顾客简介很简单,但是激发顾客却是要难得多。比方说,我们可以通过社会渠道和广告,结合移动数据分析和交易数据来建立详细的简介,但是为了激发用户,我们该用哪样数据呢?

这些问题都很复杂,就连像亚马逊、eBay这样的巨头公司都觉得很难找到确切的答案。Lindstrom指出,亚马逊自2015年起已经建立了大概六家网售实体店。不仅如此,亚马逊可能已经有了以下结论:网络不太能够提供一些有趣的零售实体店体验,比如跟一旁血拼的人突发奇想地对话,问问他们正在读什么, 亦或是在通道闲逛的时候被书面或者简介吸引过去。

结语

我个人建议公司先掌握小数据,再考虑在大数据里投资。还记得宜家家居的创始人(Kamprad)在收银台后面坐着的故事吗?他注意到,实际往来的顾客其实与宜家之前定义的目标客户群有出入,而这种差异是没法在销售点(POS)的数据中体现出来的。举个例子,宜家家居可能会想更深入地了解下那些单身的顾客买了什么家居,购买背后的原因又是什么。

先从搜集到的细微差别、反常行为中开始。深入了解你的目标客户里的一小群人(样本)并学习他们的数码产品使用行为将更有利于你去发掘他们使用模式后面的原因。这将帮助你去先定义一个假设,再开始测试它。

既然小数据速度更快、价格更低以及使用更简便,那么在决定是否在大数据方面进行投资(以此提高商务价值)之前,先掌握小数据便是非常理智的举动了。

作者介绍

[[190802]]

陈俊勋是Countly的中国与亚太区的市场经理。Countly 代表一种新类型的互动协作技术,从而为技术型和非技术型利益相关者提供一条求知和创新之路。Countly建立了一个开放的Web和移动解决方案,方便二次开发又允许公司掌握自己的数据。因此,Countly 的格言相当简单,“赢在定制” 。如果你有意向分享自己公司在数据分析的不平凡之路,欢迎随时联系 Countly(hello@count.ly)。

责任编辑:武晓燕 来源: 51CTO专栏
相关推荐

2011-02-28 09:51:43

内省

2020-12-17 17:33:47

MLOps大数据数据

2018-07-05 16:15:26

缓存数据cache miss

2016-07-18 16:20:50

戴尔

2015-06-04 10:26:50

2014-06-20 10:03:23

大数据管理工具

2018-09-10 13:47:21

数据科学统计学决策

2015-06-09 14:49:38

2021-02-25 17:54:25

大数据网约车科技

2017-08-16 09:13:27

共享充电

2010-06-28 14:47:45

云计算

2016-11-01 15:16:52

QQ状态即时通讯

2012-08-20 10:34:07

软件开发开发软件

2021-01-05 09:23:49

网页端消息

2024-10-18 14:43:31

2017-08-31 09:18:08

2020-04-07 12:19:49

5G网络4G

2019-10-21 13:58:22

爬虫互联网程序员

2009-05-06 16:10:17

Java传值引用

2009-01-12 09:56:52

点赞
收藏

51CTO技术栈公众号