“大数据”,眼下热得很。从某种意义上看,现在或未来,“得数据者得财富”,甚至“得数据者得天下”,并不夸大。因为,“大数据”不是数据大和数据多,而是从繁杂数据中摸索出规律性并加以合理应用的计算分析能力越来越“大”。
不过,“大数据”并不神秘以前无法处理的海量数据或没当做数据的东西,因为计算机计算能力的进步,现在都可以分析出子丑寅卯了。很多人逛超市,其路径与购物之间存在数据关系,而据此调整布局,就会促进销售。美国有的超市把影碟与尿布放在一起出售,就是因为他们通过“大数据”分析发现,来为孩子买尿布的大多数年轻父母,喜欢顺便带盘影碟“慰劳”自己。
如果以为有了“大数据”就没有解决不了的问题,那更是一种误解。人们的思想意识与行为模式,不同国家的存在与发展,都是复杂、曲折、独特的,计算机不可能一一描绘清楚。而期望用“大数据”来解释并指导世间万物,就颇似此前用基因等生物密码来解释、调控人类行为模式的企图,看起来客观中立,实质上以偏概全。“大数据”再“大”,也是设计者、分析者、使用者在那里说了算“大数据”并不能完全摆脱人们的曲解、隔阂和成见,再“大”的“大数据”,也会因人的因素而不够中立、全面和公正。
“大数据”潜在的负面效应,也是不应忽视的。例如,最近“大数据”被用来预测脸谱网用户的个人信息(包括性取向、种族、宗教和政治观点、性格特征等),而这些高度敏感信息,完全可能因雇主、房东、政府部门、教育机构、私营组织等的选择性使用而对个人施行歧视。
回顾这些年的“新浪潮”理念、理论和技术引入我国后,正效应的确不少,可也有一些值得注意的教训。如,在对其激情颂扬和推介中,往往缺乏不同意见和善意提醒。就“大数据”而言,国际上的质疑并不少,“大数据时代”的作者维克托就又写了一本叫《删除》的新书,强调大数据时代的信息取舍他称“遗忘是一种美德”该记的记,该忘的忘。可见,如果把“大数据”提到不恰当高度甚至神化,对用好“大数据”必是有害无益。