屠龙少年变成恶龙?聊聊推荐系统与信息茧房

系统
说到信息茧房大家都很有危机感,之前在知乎当中还有人提问,如何对抗推荐系统,避免陷入信息茧房当中。那么究竟什么是信息茧房,它又是怎么出现的呢?我们的未来真的会被推荐系统操控接触不到外界的新事物吗?

 [[352359]]

大家好,今天和大家聊聊推荐系统中的信息茧房。

说到信息茧房大家都很有危机感,之前在知乎当中还有人提问,如何对抗推荐系统,避免陷入信息茧房当中。那么究竟什么是信息茧房,它又是怎么出现的呢?我们的未来真的会被推荐系统操控接触不到外界的新事物吗?

在回答这些问题之前,我们先来信息茧房出现的原因。

马太效应与信息茧房

圣经马太福音当中有一句著名的话“凡有的还要加倍给他叫他多余,没有的,连他所有的也要夺回来”。类似的道理,在道德经当中也有出现。道德经当中说,“天之道损有余而补不足,人之道则不然,损不足而奉有余。”

这里面的道理虽然复杂,但是直观上并不难理解。越是富有的人拥有的资源越多,那么赚钱的能力也就越强,自然就会变得更加富有。越是贫穷的,赚钱的手段越少,那么自然越贫穷。在推荐系统领域也是一样的,越多人浏览的商品说明人气高,人气高的商品往往销量、评价以及各方面数据也就越好。这些指标越好的商品越容易被推荐系统选中,从而获得更多的曝光,从而陷入一个正向循环。而那些人气低的商品则对应地陷入负向循环,人气越来越低,直到最后销声匿迹。

这样会导致一个什么后果呢?会导致推荐系统运转到后来,推荐出来的都是高人气的商品,我们翻来翻去看到的商品或者是内容都是类似的。

举个简单的例子,有一段时间里B站推送了很多小姐姐,点开看基本都是一个美女封面。道理也很简单,美女养眼,吸引人,那么推来推去都是这类的视频。

这个问题并不是没有解决方案,比较好的解决方案就是个性化,也就是所谓的千人千面。说白了,就是把我们的喜好考虑进去,根据我们之前的行为推送和我们喜好比较相关的内容。现在几乎主流的推荐系统都是这么做的,淘宝、抖音莫不如此。比如我现在打开B站基本上都能说得出来每一个视频的推荐原因。

个性化的效果非常好,有了个性化之后,推荐内容的点击率大大提升,要比纯内容的点击率高上接近一倍。你想,对于公司而言,只需要招一批人,加上采购一批机器,就可以让整个公司的订单量接近翻番,这么好的事情,是不会有人不干的。

个性化虽然效果好,但是也不是全无问题,它最大的问题就是所谓的信息茧房。信息茧房的意思和马太效应差不多,意思是个性化到最后,我们看到的都是我们感兴趣的内容。我们登陆互联网,并没有拓展我们的眼界,恰恰相反,反而阻碍了我们了解更大的世界。就好像被一个看不见摸不着的信息茧包裹在了其中,不知不觉成了井底之蛙。

奇怪的悖论

上面这一大段的推论都没有任何问题,也非常符合我们的认知以及实际系统的运转规律。但是这其中有一个点非常非常奇怪,奇怪得好似一个悖论。

这个点就是推荐系统的使命与现状,你们知道为什么要有推荐系统吗?按照我们现在的理解,好像推荐系统就是为了构造信息茧房,通过大数据限制人们思想而产生的。其实恰恰相反,推荐系统的产生的使命其实就是为了反对信息茧房,反对信息闭塞。

这里面的道理也非常容易想明白,因为用户的时间是有限的,而平台的内容对于每一个用户来说几乎是无限的。比如现在的淘宝可能有上亿甚至数十亿商品,对于单个的用户来说,甚至可以说是他一辈子什么也不干一直浏览商品也不可能把这些商品全部都浏览一遍。对于用户来说,他们能够看到的商品永远只是非常小的一部分。

我们再把眼光放大一点,不仅是对于单个用户如此,对于全体用户也是一样的。整个平台用户有过浏览的商品其实也只是一小部分,有统计说这个数字可能在10%以下。这种情况的一个后果是会导致老的商品由于先发优势垄断市场,而后发的商品没有一点点机会。就好像古时候闭塞的社会一样,平民的孩子永远不可能成为精英,这是一样的道理。

正是为了解决这个问题,人们才造出了推荐系统。希望能够有一个系统能够高效地找出一些优质的但是冷门的商品,给予这样的商品机会,让喜欢它的用户能够看到它,这样可以尽可能地减少新老商品之间的流量差异。可以理解成把头部商品的流量切出一部分来给到其他优质的商品,让更多的商品得到曝光。

我们做自媒体的人常常会比较各个平台发展的难度,现在公认B站和头条都是新手比较友好的平台。这里的新手友好,其实就体现在平台对于刚起步的作者的流量扶持。一个马太效应越严重的平台,从零做起的难度就越大。而反之,说明推荐系统的效果越好,即使是数据不那么出色的内容也可以找到合适的用户推荐。

想到这里就会发现,其实这也不是什么悖论。推荐系统的使命是反抗垄断,但最终还是会产生马太效应。这并非推荐系统不给力,而是马太效应实在是太过强大。推荐系统并不足以抵消它的影响,所能做的就只有从海量的内容当中,尽可能筛选出优质的内容给予更多的机会。

对抗信息茧房

对于我们用户而言,我们上网很多时候是为了获取更多的信息,看到我们之前没看到的世界,而不是仅仅看那些我们喜欢看的。目前的状况就是各个平台的个性化做得越来越好,我们以后都会处于这样的信息茧房当中,这种情况下,我们应该怎么办呢?

很遗憾的是,关于这个问题个人和行业都没有什么很好的办法。

对于行业来说,目前还没有比个性化更好的推荐方案。因为对于大多数平台来说内容是否优质都是相对的,这就导致了几乎不论什么样的内容都有一个特定的小众的适应人群。而公司和平台追求点击率或者是业绩,那么自然不会采用那些效果不好的推荐方案。

以个人来说,我们明明喜欢看各种动漫以及各样的小姐姐,那么推荐系统投其所好给我们推荐的自然也是相关的内容。总不可能为了打破所谓的信息茧房我们非逼着自己去看我们不爱看的东西吧?即使我们真的这样做了,所谓地欺骗了系统,之后给我们推荐其他的内容了,难道就不是另外的一种信息茧房吗?而且还是我们不爱看的茧房。

从我个人角度出发,我觉得这不是一个大问题。原因有两点,第一点是推荐系统其实并不只会投其所好,我们也都知道即使我们爱看小姐姐,如果看到满屏的小姐姐还是会心生抵触的。所以现在的推荐系统除了会考虑点击率之外,推荐内容的一个多样性和丰富性也是一个重要指标。另外一点是,对于我们个人而言,互联网只是我们获取信息的工具,并不承担拓展我们世界观和眼界的重任。我们想要做到这点,需要我们自己去努力成为一个眼界开阔,爱好广泛的人。一个思想封闭的人,即使给他推送很多有内涵有价值的内容,他可能还是只会点开自己关注的那一亩三分地。

现在有一些地方过度强调“信息茧房”这个概念,把这些平台描述成了一个黑暗的操纵人心者,这些其实都是行外人的过度臆想和猜测。平台和公司追求的是业绩和利益,并没有操纵人心这样无聊且不赚钱的黑暗诉求,所以这样的观点是站不住脚的,大家也不必担心,一笑置之便是。

 本文转载自微信公众号「TechFlow」,可以通过以下二维码关注。转载本文请联系TechFlow公众号。 

 

责任编辑:武晓燕 来源: TechFlow
相关推荐

2020-11-27 10:10:52

大数据

2022-01-05 10:28:11

前端开发技术

2022-01-12 10:11:21

戴尔

2023-10-24 19:43:34

2009-12-16 14:18:22

Linux桌面系统

2020-06-05 14:45:40

Google 浏览器Chrome

2021-07-01 07:34:08

NLP推荐系统

2024-01-15 16:51:03

Redis数据存储

2022-03-03 09:51:11

RedisCouchbase数据存储

2022-03-29 09:59:58

响应式系统Vue2

2023-10-25 11:05:54

深度伪造AI

2020-06-28 07:00:00

推荐系统智能商务服务平台

2022-04-03 19:27:35

Vue2响应式系统

2022-04-06 07:28:47

数组响应式系统

2022-05-30 14:15:39

人工智能算法数据安全

2024-06-26 19:18:53

2016-01-06 10:10:25

2022-02-23 09:52:15

InnoDB数据索引

2015-09-07 09:23:07

推荐广告系统

2022-04-14 08:46:46

响应式系统js
点赞
收藏

51CTO技术栈公众号