上知天文、下知地理、运筹帷幄、决胜千里,这说的可不是诸葛亮再世,而是当下最时髦的“大数据”。
什么是大数据?目前尚无一个标准概念,那些你在网上浏览新闻、收发邮件、下单购物等网络“足迹”都以“数据”的形式被记录并存储下来。分析这些可追踪、可分析、可量化的数据,能够影响商业领域、医疗行业、政府机构的工作模式。
据《明镜周刊》报道,2012年互联网共产生2.8个10"21字节(1个10"21字节=1,000,000,000,000,000,000千字节),专家预测到2020年,新数据将增加到40个10"21字节,到那时,每天新增的数据就需要205亿个DVD光盘来存储,且每隔两年这个数据将成倍增加。
《纽约时报》《明镜周刊》接连发表文章分析大数据对各行各业的改变,并探讨对“数据暴政”(指数据驱动时代里人的隐私空间和创新能力)的担忧。
编译/许敏
[IT业] 数据也可以转变成金钱
脸书10亿用户的数据信息至少值1000亿美元
谷歌和脸书(国外的社交网站)就是纯粹的大数据。他们的商业模式是建立在对用户信息的收集、分析和分类之上,广告商通过分析结果可以精准地投放广告。对脸书的投资商而言,脸书10亿用户的数据信息至少值1000亿美元(约合人民币6131亿元)。
目前,业界将大数据的商业机会分为两类:一类是以IBM、微软、惠普等公司提供“硬件+软件+数据”的整体解决方案为代表,它以平台性为特征,提供基础服务;另一类是以脸书、亚马逊、谷歌等公司为代表,基于自身海量的用户信息,提供精准营销和个性化广告推介等。
2012年,运用大数据的全球贸易达46亿欧元(约合人民币365亿元),预计到2016年,这个数字将达到160亿欧元(约合人民币1272亿元)。
[公务] 警察吃着午饭抓到小偷
大数据使用一年,圣克鲁斯市盗窃案下降11%,警方破案率提高56%
大数据是很多人的帮手,但对于小偷来说却是绊脚石。
美国加利福尼亚圣克鲁斯市的警察在地下停车场附近就餐,没几分钟就抓住了一名偷车贼。神奇吧?其实,警察之所以会选择中午时分在停车场附近就餐,是因为大数据告诉他们那个点可能出现偷车行为。
过去两年,圣克鲁斯市近100个警察局在日常工作中都用到了大数据,通过分析警方提供的相关数据,大数据预测具体时间、具体地点可能会发生盗窃、抢劫、偷车等行为,帮助警方办案。不过杀人等行为暂时没法预测。
“一开始,我们对此都很怀疑。”圣克鲁斯市警察局副局长斯蒂芬·克拉克说。“但这些数据证明了自己的准确性和有效性。”斯蒂芬介绍,大数据使用一年来,圣克鲁斯市的盗窃案下降11%,偷车案下降8%;警方破案率提高了56%。
[娱乐] 网站预测《纸牌屋》会红
Netflix在全世界有3300万用户,比谁都清楚大家喜欢看什么电影
美国在线观影网站Netflix也受益于大数据。
Netflix最开始的业务是出租DVD,现在为3600万客户提供在线观看电影业务。通过众多数据分析,Netflix成功预测美剧《纸牌屋》会红。
Netflix在美国有2700万订阅用户,在全世界有3300万,它比谁都清楚大家喜欢看什么样的电影和电视。有研究表明每天的高峰时段网络下载量都是出自Netflix的流媒体服务,去年人们在网上看流媒体视频的时间比看实体DVD的时间还多。每天用户在Netflix上产生3000万个行为,比如你暂停、回放或者快进时都会产生一个行为,Netflix的订阅用户每天还会给出400万个评分,还会有300万次搜索请求,询问剧集播放时间和设备。
它知道用户很喜欢戴维·芬奇(《七宗罪》的导演),也知道凯文·史派西主演的片子表现都不错,还知道英剧版的《纸牌屋》很受欢迎,三者的交集预测了《纸牌屋》的成功。
[生活] “魔法地毯”能自动报警
地毯存储步伐次数,如果屋主的步数少于正常范围,会发出警报
曼彻斯特大学利用大数据发明了一种“魔法地毯”,它能帮助独居者在出现异常时及时发出警示。从外表上看,“魔法地毯”和普通地毯没啥区别,同样铺在地板上,但“魔法地毯”存储了独居者每天走路的步伐次数。如果独居者这一天走路的步数少于正常范围,“魔法地毯”就会发出警报,尽早提醒是否出现意外。
由85个雇员组成的公司BlueYonder是一家分析大数据的公司。该公司通过综合梳理超市刷卡信息、天气资讯、学校放假信息以及交通报告等数据,为像沃尔玛这样的零售商提供“精准的预测”。
这些“预测”对商家来说非常重要,因为它能避免发货错误、降低存储成本。
举个例子,BlueYonder曾建议某家超市将牛奶、巧克力棒和苹果放在一起,几天之后,这三种商品销售量大增。真正的原因是,BlueYonder了解到超市附近新开一所学校,公司分析了人群特征得出了结论。
观点:需要警惕“数据暴政”
没错,大数据之于商业等领域真是如虎添翼。但对普通消费者来说,利与弊孰轻孰重?
一份由奥美公司所作的调查报告显示,75%的人不希望企业存储自己的个人信息,有90%的人反对企业收集自己上网浏览网页的记录。
微软研究院的高级研究员博伊德曾表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”
人们最担心的,是对这种数据的无限制利用。美国畅销书《爆发》中指出,人的行为看似随机无序,但实际上是存在某种规律的。社交网络如此发达的今天,大数据把人的行为进行放大分析,从而能够相对准确地预测人的性格和行程。所以,不排除有这样一种可能:在忙完了一天的工作之后,你还没有决定要去哪儿,数据中心却早就先于你准确预测了接下来的目的地。
这向我们提出警醒:大数据时代,如何界定大数据的权益归属?如何控制大数据的使用风险?如何保持我们全社会的数据民主?
另外,有多少人会真的愿意接受一个“数字驱动经济”的世界?那些数据能预测你的孩子在学校表现得怎样、什么工作适合他/她、他/她有多大可能会变成罪犯、有多大可能会患病,你真的愿意活在一个如此清晰预测未来的世界?
电视台或音乐唱片公司通过数据分析能够较好地迎合观众或听众的口味,但对于创意产业来说真的利大于弊吗?那些创新、直觉和惊喜又去哪里了呢?
互联网专家叶夫根尼·莫罗佐夫提出“数据暴政”的概念,他指出,那些基于大数据制定的政治、经济决策,每隔一段时间要由独立的审计员进行核查,以防出现滥用数字力量的情况。