大数据是一场人人都想抓住的变革机遇。不管是IT巨头还是创业小团队,都想在这个极具变化的变革初期占领一席之地,立名、掘金、抢占话语权。
正如知名IT评论人谢文所说:“大数据之所以可能成为一个时代,在很多程度上是因为这是一个可以由社会各界广泛参与,八面出击,处处结果的社会运动,而不仅仅是少数专家学者的研究对象”。数据产生于各行各业,这场变革也必将影响到各行各业,因此,机遇也蕴含于各行各业。致力于IT创业的人们紧紧盯着这个市场,洞察着每一个机遇。
如果说云计算主要提供了强大的后台运算能力,对大众来说,看不见摸不着;那么大数据却是和人们的生活紧密相关的。大数据应用随处可见可感可知。
大数据与公共安全
未来,大数据将成为社会基础设施的一部分,跟公路、自来水、电一样,成为人们生活不可或缺的一部分。但大数据的作用并不仅仅局限于为普通消费者提供生活必须服务,更可以有效协助公安部门提供公共安全服务。而数据的有效利用并服务于社会则需要数据的公开和共享。
4月15日发生的波士顿马拉松爆炸案造成3人死亡,多人受伤。FBI在波士顿马拉松爆炸事件后在案发现场附近采集了10TB左右的数据。虽然通过大数据“已经锁定并逮捕嫌疑犯”的报道已被FBI和波士顿警察局声明谴责,但未来大数据分析技术炉火纯青以后,社交媒体规范和信息分享机制健全,数据来源和质量可靠,那利用大数据锁定嫌疑犯将变得简单而高效。
利用大数据还可以预防和打击犯罪。密歇根大学曾在网上发布报告指出,研究人员正在用“超级计算机以及大量数据”来帮助警方定位那些最易受到不法份子侵扰片区的方法,利用大量数据创建一张波士顿犯罪高发地区热点图。在研究某一片区的犯罪率时,他们还将相邻片区的各种因素列为他们考虑的对象。随着将越来越多的数据加入到研究中来,研究者们认为他们能在额外变量是如何影响犯罪率这一问题上得到更准确的结论,并且为警察更具针对性的锁定犯罪易发点、抓获逃犯提供支持。
大数据开发和应用还有助于完善救灾系统。7·21北京暴雨发生时,由于求救人数众多,救援电话被打爆,被困人员无法从官方获得帮助,从而转向微博平台。一条包含人物、时间和地点三要素的微博可迅速了解救援所需,打开微博附加坐标数据即可实现地图定位,为及时救灾提供方便。雅安地震中,除了微博再次凸显新媒体传播优势外,微信群及各大互联网公司推出的寻人平台也为救灾提供了多渠道支持。但各大网站数据并不互通,而且数据的低精确度和低效成为最大弊端。若要发挥数据的最大价值,数据必须是在线、公开、共享、互联、相关的。由此看出,数据的公开和共享是一件有必要且有待解决的事情。
实践代表:各国政府 #p#
大数据与医疗健康
“个性化医疗”和“量化自我”是近期比较火的两个词。在大数据时代,人们会长期监测自身健康数据,“预防”比“治疗”变得更重要,而且医生会通过分析病人的历史数据给出个性化治疗方案。
利用大数据的分析方法可以分析人类基因序列,得出基金突变的概率,提前避免疾病的发生。根据美国《人物》杂志的报道,奥斯卡最佳女主角于安吉丽娜·朱莉基因突变,患上乳腺癌的几率高达87%,患上卵巢癌的几率高达50%。5月中旬,朱莉已接受双乳乳腺切除手术,近期,还要切除卵巢,以降低致癌风险。
在个性化医疗领域,康诺云今年即将推出的可佩戴设备可收集和监测佩戴者的血压、心率等,并将这些数据上传至云后台,通过分析佩戴者的数据,预测其健康状况和未来某种疾病的发病概率。若这些数据出现异常,则会收到手机提醒,甚至会给出对应的解决方案。
另外,GE和Intel正联合开发一个大数据“魔毯”项目,其原型使用家中地毯内装的传感器感应缺乏人照料的老人下床和行走的速度和压力,一旦这些数据发生异常则对老人的亲人发送一个警报。
此外,利用大数据技术还可以制定量身打造的健身计划。咕咚手环是首款基于百度云开发的便携式可穿戴设备,主打“运动状况提醒”、“睡眠监测”、“智能无声唤醒”三大功能。知名运动品牌耐克还推出了"Nike+"跑鞋,通过无线Nike+iPod运动组件与iPod实现信息互通,将Nike+运动鞋与iPod连接后,iPod就可以存储并显示运动日期,时间、距离、热量消耗值和总运动次数,运动时间,总距离和总卡路里等数据。
目前大数据在医疗领域的应用可谓是风生水起,百家争鸣,大家都看到了这一领域的机遇,并想分一杯羹,只是由于基础设施、用户习惯、法律法规等等方面的限制,目前并未出现非常成功的案例。
实践代表:康诺云、咕咚手环、Jawbone up #p#
大数据与娱乐
大数据时代,只要你上网,使用社交产品,那么就没有谁会比商家更了解你。你可能还没考虑过自己最喜欢哪个电影明星,最喜欢哪种类型的影片,是喜欢在家看电影还是喜欢影院看,但拥有数据的商家已经对你了如指掌了。未来,不管你的品味多么与众不同,多么挑剔,你肯定能找到符合自己的娱乐项目。因为你的历史数据会告诉商家有诸如你这样一类人群的存在。有利可图的事情,都会有人去做;任何一个市场空白,只要被人发现了都会被填补。
《纸牌屋》的成功在一定程度上得益于大数据,其出品方Netflix称挖掘其用户行为的“大数据”已经很长时间,《纸牌屋》是其数据分析结果的第一次战略运用。通过数据分析,Netflix甚至比观众还要清楚他们的观影喜好。据悉,该网站基于3000万北美用户观看视频时留下的行为数据,推测出一部剧的关键要素可以是凯文·史派西、大卫·芬奇和BBC出品三者的交集,可以获得成功,于是打造了《纸牌屋》。
一支叫熊战士(Bear Warrior)的朋克乐队设计了一台名为“POGO温度计”的设备,可以通过安装在音乐厅地毯中的一系列感应器检测出听众舞步的强度,然后将信号发送到一台中央计算机,最后让中央计算机对信号进行分析研究,帮助乐队改进他们的演绎方式。乐队主唱表示:“这些数据可以帮助我们了解到我们还可以如何去改善我们的演绎方式,让听众对我们的音乐作品作出我们希望看到的回应。”
此外,微软研究院计算机专家David Rothschild通过数据分析预测奥斯卡金像奖得主,他表示:“我预测奥斯卡金像奖得主的方法与预测其它事情的方法完全相同,其中包括政治。首先关注最有效的数据,然后创建不受任何特别年份结果干扰的统计模型,所有模型都根据历史数据进行测试、校正,我们在建模时很有耐心,确保模型能够正确预测外样本结果,而不仅仅是过去发生的结果。我们创建的模型是用来预测未来的,而不是预测过去的。”
5月29日,林俊杰《因你而在》微电影完整版通过QQ音乐独家首发,这种通过系列微电影推广专辑的线上营销方式算是唱片领域的新尝试。我相信,用户是否打开连接、是否全部看完、详细观看哪个片段、在什么地方快进或暂停等等这样数据最终都会被华纳唱片公司收集和掌握,从而分析用户喜好,为下一张专辑的制作提供科学依据。
实践代表:Netflix、乐视TV #p#
大数据与农业
市场经济的弊端之一即具有滞后性,这对三大产业影响最大的就是农业。由于在市场经济条件下,农业生产很难在全国范围内形成统一规划,致使农业生产受市场波动影响颇大,而且农业生产很多方面依靠的是感觉和经验,并没有量化的数据支撑。大数据时代,不仅可以通过建立统一的数据平台,调控农业生产;还可以记录分析农产品种植过程中的数据,通过分析数据,决定浇水、施肥、光照、温度等条件,从而提高产量。
连锁型的社区生鲜超市M6于8年前就开始了数据化管理,物品一经收银员扫描,总部的服务器马上就能知道哪个门店,哪些消费者买了什么。M6免费为顾客办理实名制会员卡,用户持卡结账可以享受优惠,但M6不找零,这样一来,既可以提高收银效率,又为数据分析提供基础。在一些细节上,M6的收银模块甚至比一些大商超更细致,比如,信息被扫描进系统后,顾客突然要求退掉其中一件或几件,或者整单退掉,为什么要退掉,这些信息全都被写入了后台数据库。2012年,M6的服务器开始从互联网上采集天气数据,然后,从中国农历正月初一开始推算,分析不同节气和温度下,顾客的生鲜购买习惯会发生哪些变化。
日本宫崎县西南部的“都城”市已经开始利用云和大数据进行农业生产。通过传感器、摄像头等各种终端和应用收集和采集农产品的各项指标,并将数据汇聚到云端进行实时监测、分析和管理。富士通和新福青果合作进行卷心菜的生产改革。两家公司在农田里安装了内置摄像头的传感器。把每天的气温、湿度、雨量、农田的图像储存到云端。还向农民发放了智能手机和平板电脑,让大家随时记录工作成果和现场注意到的问题,也都保存到云端。卷心菜增产3成,光合作用也实现IT管理
实践代表:M6、富士通、新福青果
其实,大数据与交通、金融、制造、教育、商业等领域均有密切关系。《大数据中国》第二期将集中探讨大数据的跨界旋风,盘点、分析、评论大数据在医疗、金融、商业、教育、制造、农业、交通、天气、娱乐、电商物流等十个领域的应用发展和实践情况,敬请大家关注,并欢迎投稿和联络采访。