Google 搜索背后的数据

系统
对于互联网用户来说,搜索是一件非常简单的事情。在搜索框输入关键词,回车(或点击搜索框),等待。而对于搜索公司来说,这是一个复杂的技术问题。从你开始搜索到获得结果的短暂时间里,究竟发生了什么?从 Google 发给 Mashable 网站的这幅信息图里,我们可以了解到一些相关的数据。

 

GoogleSearchInfographic_conew1

对于互联网用户来说,搜索是一件非常简单的事情。在搜索框输入关键词,回车(或点击搜索框),等待。而对于搜索公司来说,这是一个复杂的技术问题。从你开始搜索到获得结果的短暂时间里,究竟发生了什么?从 Google 发给 Mashable 网站的这幅信息图里,我们可以了解到一些相关的数据。

搜索之前

在你进行搜索之前,Google 的搜索爬虫已经走遍了整个网络,它们从一个链接跳到另一个链接,将数据带回 Google 的服务器。网络就像是一本书,Google 的工作就是为图书建立目录。

Google 建立的目录,其容量已经超过 1 亿 GB。目前为止,Google 已经花费了 100 万个机器小时来构建目录。

搜索之时

从查询开始到获得结果,搜索查询的平均旅行路程是 1500 公里。在此过程中,它可能经过全球不同的数据中心。根据 Google 的说法,1500 是一个平均数字,具体到每次搜索产生的路程不会这么长,因为 Google 总是会寻找最近的数据中心。在用户键入搜索查询的时候,Google 就开始提供对查询的预测,以减少键入时间,这就是 Google Instant。

排名

Google 的排序算法会根据 200 多个信号来决定相关结果。每年,Google 对排序算法有 500 多项改进。这些信号包括:

网页内容的新鲜程度;网站内容的质量;网页的地址和标题;其它网站对某特定站点的链接,以及这些链接的权威性;最好的搜索结果是什么,网页、图片、视频、新闻、个人结果等;网页上的单词;拼写检查;个性化(与你关联的人推荐的结果)。

搜索结果

搜索结果根据相关性排序,同时,Google 还提供了网页预览功能。

每天在 Google 上产生的搜索超过亿次;网页预览的平均加载时间是 1/10 秒;从 2003 年以来,Google 已经回答了 4500 亿个新查询;每天都有 16% 的新查询出现。

 

GoogleSearchInfographic

【编辑推荐】

  1. 谷歌Gmail服务宕机 具体原因正在调查
  2. 后火狐时代Mozilla处境尴尬与谷歌关系成迷
  3. 谷歌新Chrome OS:看起来更像是Windows
责任编辑:Yeva 来源: ifanr
相关推荐

2013-08-14 11:14:20

开源Google

2009-01-04 09:26:44

架构Google服务器

2011-12-07 10:31:36

Google新闻

2012-05-27 20:15:24

三星

2013-07-30 12:29:19

Google App Google技术Engine

2011-08-01 11:56:45

Google搜索

2011-04-15 17:43:15

Google App Google

2009-04-23 15:03:06

谷歌Chrome拉斯·巴克

2011-01-06 16:36:05

云计算Google

2013-05-24 09:57:28

搜索流程搜索产品设计搜索设计

2020-10-23 13:06:57

Google网络犯罪

2012-03-13 10:05:54

Google算法

2009-10-19 09:51:16

零宽带费

2015-08-24 10:16:53

Google雷击技术架构 分布式UPS

2011-12-12 09:46:46

2011-08-03 09:43:10

Chrome 13Google

2009-08-24 10:10:43

音频搜索Google List

2010-08-23 09:37:47

2020-08-10 14:39:30

搜索引擎

2012-09-18 09:27:51

点赞
收藏

51CTO技术栈公众号