【51CTO特约报道】2013年7月13-14日, 由阿里巴巴集团主办的ADC·阿里技术嘉年华将在杭州海外海国际会展中心举行,2011年举办首届,今年是第三届,已发展为互联网行业最开放、最实战派的技术交流盛会之一。被大家视为码农典范的技术大神MySQl的创始人Michael Widenius,将作为嘉宾现场分享。
本届嘉年华设置了大数据技术与应用、无线技术、业务架构&后端技术、前端技术、搜索、广告、体验设计、互联网测试、系统开发和运维等九大分场,共有80多个主题,其中包括了阿里巴巴、腾讯、百度及更多知名的互联网公司的在实践中积累起来的技术经验。比如阿里巴巴的去IOE、新浪微博的系统稳定性等主题都反映了业界的主流的工程技术方向。
本次演讲来自于阿里巴巴中文SEO领域owner 周文军,话题是《大型网站SEO优化实践》。周文军从无到有建立了一套完善的SEO优化体系,通过在CBU探索实践,SEO流量相比2011年增长了143%。他将从SEO定位,策略,监控等方面与大家浅谈大型网站SEO优化实践的那些事儿。
周文军一开始就给大家介绍了URL规范旧状以及带来的一些问题和挑战。那么对于周文军所说的URL规范旧状以及问题与挑战主要表现在那些地方呢?从周文军的演讲过程中,小编分别记下了主要的四个点:
URL规范旧状:
- 多域名;
- 全静态化,全动态化,半静态化等多套URL规范;
- URL层级太深;
- URL解析代码复制冗余,性能低,关键是维护成本高。
问题与挑战:
- 参数全静态化,本质还是动态化,SEO效果差。
- 跟前端工程师合作效率低。比如JS拼接静态URL问题。
- URL中特殊字符解析问题。比如%2F(/),%4E(N)等。
- form表单提交产生多余的301挑战,增加前端性能负担(20ms左右)。
那么周文军是如何跟大家给出的URL规范化以及相关的问题对策呢?下面给出了对于搜索引擎应该如何面对方式:
- noindox,nofollow标签
- 301跳转
- canonical标签
- webmaster可设置动态参数处理方式
接下来是周文军给大家分享的如何提升网站核心资源被爬取效,主要针对抓取的网页数量,编入索引的网页总数,和robots阻止的网页数。
对于引导爬虫抓取网站的核心资源我们应该作何去做呢?当然了,站点扁平结构,重点优化面包屑这些是非常重要的。sitemap每日全量更新,补充spider URL库和页面部分推荐模块异步改同步加载,核心资源URL部署到权重高的页面。这样的话就很容易引导爬虫抓取我们网站的核心内容或者资源。
为了减少无效的URL抓取,我们也做了一些相关的对策。比如对robotst.txt禁止无效URL被抓取及被索引,还有通过noindex meta标签禁止URL被索引,不过周文军老师提示了百度暂不支持noindex。不过大家可以考虑nofollow的使用,这样也能减少无效URL的抓取。
对于提升网站抓取量,周文军老师给出了三个思路:
- 避免搜索引擎官方爬虫被安全软件拦截;
- 逐步上调站长平台抓取压力
- 及时更新死链sitemap
在大型网站SEO优化中后期,我们应该注重哪几个问题呢?这也是大家经常苦恼的问题。周老师跟大家说了一个词为“Query”。对!就是要专注Query的分析,比如用户搜索的query是否match页面Title中的关键词,或者词库分库分档,再者就是思考Search Query=Search Requirement。
当然了,还有相关的调排名,这里有个准则,就是对排在第二及第三页的关键词,我们会重点分析及调优。优化第三页以后的关键词,投入产出比极低。再者就是研究anti-spam,就是坚持白帽,杜绝黑帽。研究anti-spam主要防治不正确优化被判作弊。
周文军老师给出的全站SEO效果监控图
相关的分析工具
还有一个对于移动WAP SEO的优化,周文军老师给出了5点建议。
第一,自助适配,在Apache服务器上根据user-agent自主适配到WAP页;
第二,标注Meta声明;
第三,开放适配协议,在百度站长平台提交开放适配协议,如适配协议与页面标注Meta声明冲突,以适配协议为准;
第四,DOCTYPE声明,DOCTYPE声明有助于搜索引擎识别该页面是否适合手机浏览,wap页协议分别为:xhtml协议,wml协议,HTML5协议;
第五,移动标准sitemap,google有特定的移动标准sitemap。
最后,周文军老师给大家分享了大公司SEO项目合作方式及相关挑战: