谈如何提高网页信噪比

开发 前端
在网页优化中,搜索引擎主要抓取除去html标签后的文本内容,这部分内容可以认为是不失真声音信号,而同时产生的那部分html标签内容, 可以被认为是噪声。本文介绍的是我们该怎么样提高网页的信噪比呢??

网页信噪比是指一个网页上的文字内容与所有HTML代码的比率,这同样是我们所必须了解的SEO基础知识。从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除HTML格式,清除噪音,然后分词,***存入索引库。

在这个过程中,搜索引擎也会经过去噪的过程,我们很明显地就能知道,网页信噪比越高,搜索引擎蜘蛛抓取的效率越高,搜索蜘蛛每天要处理的文档非常之多,如何能够快速的提取网页的主题信息是个重要任务。

其实信噪比的概念来源于声学,原本是指输出的声讯信号与产生的噪音的比率,应用到网页上实际上不单单是指所有本文与代码的比率,还包括了当前页面文本内容中的有用信息与无用信息的比率。

何谓有用信息,就比如我这篇文章的主题是网页信噪比,整篇文章有1000个字,而当前页面所有的文字内容有2000个文字,而其他文字是与信噪比无关的,那这些无关的信息就是噪音了。所以,提高网页信噪比分为两个方面:包括优化代码和优化内容。

一、去除噪音代码

我们知道,搜索引擎去噪的***步则是清除HTML格式,那么提高网页信噪比的***步就是优化HTML代码。为什么我们常说,网页代码要符合W3C标准、代码要简洁、要用DIV+CSS,其实都是基于这个原理。

实际上,很多朋友只是看到网上的文章说要这样去写代码,但却不知道为何要这么做,这也是我建议大家先学习SEO原理的原因(我知道,实践大于理论,但如果理论都没有,怎么去实践,没有一个出发点)。去除噪音代码包括以下几个方面:

(1)减少JS使用,必须要用的JS代码进行封装。 

(2)将CSS代码进行封装。

(3)减少DIV层嵌套(很多朋友不知道原理的话,一味地追求DIV+CSS,却同样产生大量冗余的代码。)

(4)减少图片、FLASH的使用

二、去除噪音内容

同样的,搜索引擎提取网页文本内容后,还要进行分析二次去噪,也就是确定当前网页的主题。那么在这个过程中,我们如何让搜索引擎更精确地判断我们的网页主题(这也就是相关性的问题),如何提高网页的相关性?那么就是降低页面噪音内容。

我们很常见的就是一些电子商务网站的商品详细页面,可能一部分做电子商务网站SEO的人员并未注意,在产品介绍内容下面有一些关于配送方式或者帮助信息的说明,这些内容的存在,提高了各个产品页的相似度,同时也降低了信噪比。

这些信息从用户体验的角度来讲是友好的,是提升网站的信任度,但从搜索引擎的角度来讲是有一定不利的,所以我们可以将这些内容使用IFRAME或者JS来封装调用,这样双方都照顾到。主要也是有包括以下几个方面:

(1)重复内容进行封装调用

(2)导出不必要的链接列表进行封装调用

(3)精简版权信息

(4)增加相关内容的文本长度

方法是以上几个,具体如何实现还要看自己对技术的了解或者掌握。虽然我们知道搜索引擎在索引预处理阶段会对网页进行去噪处理,但如果我们自己做好了网页信噪比的提高,一方面减轻了搜索引擎的工作量,从而提升其在我们网站上抓取索引的效率,一方面提升了搜索引擎判断的准确度。那么,可想而知,我们的网页是更加被信任的。

原文地址:http://www.xiaohan86.com/2011061188.html

【编辑推荐】

  1. 企业网站SEO优化如何进行外链建设
  2. 浅谈SEO搜索引擎优化经验
  3. SEO请相信“锚文本”的力量
  4. 剖析SEO 网站排名是“养”出来的
  5. 做好这六点 SEO优化将不再难
责任编辑:于铁 来源: 萧涵SEO
相关推荐

2024-06-27 11:00:07

2023-11-08 15:01:12

2013-07-29 12:45:19

iOS开发经验iOS提高应用开发效率

2011-09-09 11:09:26

Web

2010-09-09 15:35:46

CSS工具

2011-06-09 16:14:14

2021-07-14 14:06:06

CSS前端浏览器

2011-04-11 14:56:09

Oracle性能

2017-08-18 13:02:15

大数据数据质量

2011-05-18 08:55:43

代码程序员

2011-06-19 09:15:25

搜索引擎

2017-12-12 16:43:54

SparkHadoop水平

2015-10-10 11:00:05

RubyRails性能

2011-06-11 22:39:33

网页静态化

2015-10-14 17:27:18

性能

2016-09-07 15:02:03

ElasticSear索引速度

2023-11-21 11:15:58

智能驾驶

2011-04-29 17:26:56

学生打印机选购

2013-01-22 09:14:58

云网关云存储云网关设备

2009-03-20 10:06:21

程序员PHP职场
点赞
收藏

51CTO技术栈公众号