大数据时代,如何避免陷入“算法崇拜”?

大数据 算法
要防止陷入"算法崇拜",还需从源头上了解算法的前世今生,而算法是和数据紧密联系,算法源于大量数据的产生和沉淀,为了让数据具备可追溯和可归纳,同时让数据具备商业化价值,各种各样的算法产生了。

"数据"在今天从来没有如此被广泛关注,以往我们毫不在意地填写手机号码等信息,如今却变得谨慎起来,原因是怕自己的隐私泄露,一个手机号码可以关联到自己诸多的数据。但现实当中,一方面大众对数据被过度使用而烦恼,但另一方面我们可能陷入了"算法崇拜"之中,而算法就是以数据为基础的技术原理。

大数据时代,如何避免陷入“算法崇拜”?

比如我们一早起来会打开墨迹天气,看看今天的天气怎么样,APP会提醒穿什么衣服?要不要带伞?出门的时候,会打开百度或者高德地图,看看上班路上堵不堵?今天是否限行?等等,这些行为已经成为了一种生活的习惯。

从技术的角度来讲,上述行为实际是APP内核的算法导致的,是一种轻度的"算法依赖",对大众而言,并没有算法的概念,顶多是"APP依赖"或者"数字化生活的依赖",但如果过度地依赖算法为我们的生活、工作做决策时,你可能就陷入了"算法崇拜",从心理上可以理解为"技术迷信"的非理性行为,而后果则是被算法左右你的内心而迷失方向。

01、大数据与算法

要防止陷入"算法崇拜",还需从源头上了解算法的前世今生,而算法是和数据紧密联系,算法源于大量数据的产生和沉淀,为了让数据具备可追溯和可归纳,同时让数据具备商业化价值,各种各样的算法产生了。

举个例子,墨迹天气APP是较早的提供天气实时服务的手机应用,它的技术原理是通过对接公共开放的天气数据接口(技术上叫API接口),获得海量的、实时的天气数据,获得的原始数据只是各种有关天气的参数,普通人根本看不懂,怎么让大众都能直观的看明白呢?

于是产品经理设计出APP呈现出来的视觉效果和产品的实现逻辑,而JAVA工程师开发出整个APP的系统后台供数据导入,关键的原始天气数据则由算法工程师根据产品模型进行逻辑演算,最终呈现出来就是我们看到的APP界面。

再深入理解一下这个案例,比如我们看到墨迹天气APP今天显示温度是20度,下雨,于是算法工程师会把类似温度、下雨量等数据综合分析,然后再提取与这个温度适配的穿衣出行的常规数据,比如天气是下雨的20度,会提醒你穿秋衣并且带伞,而不下雨的20度,则会提醒你穿秋衣和利于出行游玩。

更厉害的算法还会进行深度计算,除了利于出行游玩,还会推荐周边哪些地方适合游玩等信息,这就需要APP除了对接天气数据,还需要对接生活、出行和旅游景点等数据。

通过上述案例,我们看到一款优质APP算法的复杂性,也正是因为算法的复杂程度,包括获取各种数据的渠道和难度不一,结果是建立了一定的技术壁垒,同时,技术其实都是通用的,关键是数据壁垒让竞争对手无法超越,从而产生了"信任垄断"效应,由此逐步在用户心目中建立了信任感而引发"算法崇拜",这点我们在下节详述。

对于技术,我们一贯的观点是技术的就是人文的,技术终归是为人性服务,大数据和算法也不例外,脱离了人性的技术,也就无所谓应用和商业价值。

既然算法是源于数据,我们先看一下数据到底是什么?根据科技作家,原阿里副总裁涂子沛老师在《大数据》中非技术语言的描述:

数据分为两种,一种是小数据,就是像气温、面积、大小等源于测量的数据,或者一般性统计,如人口多少、土地面积多少这些常规的数据;另一种就是大数据,源于记录的行为,也就是基于有信息背景的数据,有规律可循、有行为痕迹可循。过往的大数据通过各种行为的记录,今天则是产生于无处不在的传感器和微处理器。

海量的数据无论是小数据还是大数据,首先是一个沉淀的过程,当我们需要数据时,会从一个个数据仓库中提取数据进行数据清洗,这个过程把不需要的数据过滤掉,留下对自己有价值的数据,最后进行数据分析和演算,而分析和演算就是通过算法来实现。

目前,我们通过算法主要演绎四种数据,分别是:

  1. 行为数据:也就是我们生活和工作的各种行为产生的数据。如餐厅消费、坐地铁打车等;
  2. 状态数据:即某个事物或生物的固有状态数据。如台风参数、森林绿化指标、人体状态等;
  3. 社交数据:我们通过微博、微信、抖音等社交媒体产生的登陆、时间、评论、分享等行为数据;
  4. 工业数据:生产、设计和制造过程中产生的数据,这是工业智能化的基础。

而算法就是基本基于以上四种数据进行各种分析、演绎和模型输出,最终呈现出我们看到的各种应用,包括人工智能和物联网的发展,也是基于算法来实现。比如搜索引擎的推荐算法、地图应用的导航算法、外卖APP的排名算法、音乐APP的偏好算法等等。

正是大数据的庞大和算法的复杂,导致的数据壁垒使得算法呈现神秘感,而从古开始,人们对未知领域力量的感知会油然而生一种莫名的信仰和崇拜,就如对神秘的太空一般。

02、崇拜和权威

就如近代欧洲历史上,科学的发展与宗教产生了激烈的对立,数据算法也在挑战传统的认知,过去人们要了解天气的变化趋势,往往凭借经验看天做判断,过去看病也是遵循传统的望闻问切,但今天,这些传统的经验正在遭受数据算法的挑战。

我们看天气通过手机的算法推送,甚至一些常见的病状都通过搜索引擎搜索解决办法,另外,像音乐CD这样的传统听歌方式正成为小部分音乐极客的爱好,大众则享受网易云音乐、QQ音乐等的智能推荐,过去的车载导航已经没有市场,百度地图和高德地图可以解决一切导航问题。

这是科技发展,数据算法给我们带来的便捷,我们乐于享受这样免费的服务,但如果完全依赖于算法,也会导致你意想不到的后果。

比如前几年有新闻称某位司机遵循手机导航而找不到方向,另外,有的公司在管理过程中过于遵循数据结果而忽视人性化管理导致的团队离职,甚至连为刚出生的孩子取名,也会到网上输入备选的姓名查询一下分数多少。

为什么会这样?因为我们相信数据算法的权威性高于人为的判断。而崇拜的产生就是基于对权威性的认可。

什么是权威性?我们经常听到类似于"权威解读"、"某某领域权威专家"、"拥有某某权威技术"的说法。

百科对权威有五个解释:

一指权力和威势;二是使人信从的力量和威望;三是统治和威慑;四是在某个范围里最有地位的人或事物;五是对权力的一种自愿的服从和权力。

那么从本文分析的角度看,所谓"算法崇拜"可以解释为:基于数据算法拥有让人信从的力量,从而产生权威感,让人自愿地信服而排斥其它影响判断的因素。比如我们在开车时,相信导航APP的程度会高于相信司机和旁人的经验。在点外卖时,相信饿了么的推荐排名会甚于同事的建议等等。

对数据算法产生权威感和崇拜,我们分析来自于以下三个因素:

  1. 认知迷惘。对某个领域存在认知的困难和迷惘,而恰恰数据算法解决了这个问题导致的信任。比如我无法判断天气和某个陌生城市的路线,但某个天气或地图APP帮我解决了这些问题。
  2. 数据处理难度。能人为判断数据的处理难度而自身无法解决,但数据算法轻易地解决掉导致的信任。比如AlphaGo能凭借超强算法打败人类冠军,而自己无法做到这点。
  • 人性固有的惰性。技术的发展让人变懒已经成为一种公认的事实,当数据算法能解决的事情,我们往往不会人为地去干扰,就如以前我们会自己打扫房间,但基于智能算法的扫地机问世后,通过对房间数据的计算可以智能地清扫指定的区域,从而取代了人工打扫,这是一种进步还是倒退?

对于数据算法的崇拜,我们始终认为并不是算法而是人为导致,我们并不否认算法的发展,适度崇拜而非迷信和过度信任,也许是我们的最佳选择。

03、理性与回归

无论数据算法如何的智能,面对技术的发展,我们还需回归到理性中来,执着于某个权威,我们可能会失去看问题的多元视角。

比如做市场决策,尽管数据算法提供了诸多可供参考的依据,但消费者的内心是算法无法顾及的,我们还需要辅之以大量的潜在用户的真实感受,地图APP很强大,我们也要兼顾自己的感官和向当地人了解实际的路况。

避免陷入过度的"算法崇拜",最重要的是避免过度,过度崇拜就是迷信,迷信的结果不仅仅是失去多元视角,更可怕的是迷失自我,失去应有的理性判断。

所以,基于上文的讨论,我们提供以下的参考以避免过度地沉迷于数据算法:

  1. 多方视角很重要。相信数据算法,但不要依赖于单一的数据结果,有的科学家论证一个结论时,往往会用大量的第三方数据作为辅证,这就是多方视角,对于特定领域的同一结果,往往会有不同的数据算法,会导致结果不一,这就需要我们采用多方视角相互比对才能得出正确的结论。
  2. 必要的人为干扰。对于数据算法得出的结论,或者本身参与数据算法,可以根据情况进行必要的人为干扰,以加强算法的全局性。比如公司委托第三方开发一个财务投资系统,通用的投资逻辑还需要考虑公司的投资理念和风控性格才能做出适合公司的投资系统。
  3. 保持对事物的好奇心。这是底层思维逻辑,决定上层的认知和判断,对凡事并不轻信而是带着批判思维,也有助于避免陷入个人的偏听偏信之中。

结语:

以上三个部分是我们对"算法崇拜"的几点分析,我们不否认算法的伟大,也不排斥适度地崇拜算法,但我们提倡理性地认识和使用,哲学家周国平先生说:好奇心是人的理性开端,最基本的元素。如何避免陷入"算法崇拜",除了了解数据和算法本身,保持我们的好奇心也许能从思维底层搭建我们的理性思维世界。

责任编辑:未丽燕 来源: 今日头条
相关推荐

2020-12-07 10:19:01

程序员技术IT

2015-09-14 10:03:23

云锁定网络服务云供应商

2020-06-01 15:04:44

甲骨文自治数据库

2015-06-02 11:10:20

2018-07-23 14:51:22

2016-05-11 10:56:52

数据崇拜

2022-04-23 17:18:53

数据胡扯算法

2013-05-31 10:22:12

2011-07-27 09:32:27

2015-08-13 10:56:47

数据挖掘

2013-08-20 09:26:03

大数据时代hadoop

2021-08-03 22:56:01

大数据流量软件

2019-07-05 16:40:22

大数据信息安全网络安全

2015-04-02 11:33:38

大数据时代教育研究

2013-09-17 18:24:46

SAP

2013-12-02 10:02:30

大数据时代

2012-02-27 09:39:11

数据中心大数据

2017-12-20 15:25:51

数据分析大数据企业

2020-11-27 10:10:52

大数据

2011-12-09 11:23:22

移动数据安全
点赞
收藏

51CTO技术栈公众号