在很多情况下我们明明没有发布重复页面,但为什么产生重复呢?下面我们一起来看看哪些情况容易造成重复页面?以及我们应该如何处理?
一. 域名
abc.com
www.abc.com
abc.com/index.html
www.abc.com/index.html
在浏览器地址栏中输入这四个不同的URL链接,打开的都会是首页。对于用户来说,没有什么不同;但对于搜索引擎来说,这是4个不同的URL链接,却是相同的页面内容,会被误认为有作弊的嫌疑,不清楚哪个URL才是真正的首页,网站的权重也会分散到每一个URL上。
如何解决呢?最佳的方法是确定一个首选域,一般为abc.com或www.abc.com,然后将其他三个链接301重定向到这一个首选域上,将网站的权重统一集中到首选域。
关于301重定向的方法可以参考:《301重定向》。
二. tag标签
很多网站因为设计的问题,很容易被人忽视的tag标签极易造成重复。
比如某篇文章本身是在SEO分类目录下,URL链接为abc.com/seo/123.html,但同时给这篇文章添加了一个tag标签为marketing,通过这个tag标签却重新生成了一个新链接为abc.com/tag/marketing/123.html,这就造成了同样的页面内容却对应着两个不同的URL链接。
如何解决呢?方法①找网站开发人员实现301重定向到指定的某一URL链接上,一般跳转到分类目录下的链接;方法②在robots协议中申明禁止搜索引擎蜘蛛抓取tag标签下的链接:Disallow: /tag/。
三. 其他情况
比如我们经常容易忽视的一些问题:
1. 打印页面
比如:abc.com/sem/123.html与abc.com/sem/123.html/print
第一个是文章页,第二个是打印页。内容都是一致的,URL链接却不同。
2. 文章字体大小调整
比如:abc.com/sem/456.html与abc.com/sem/456.html/a
第一个是正常文章页,第二个是字体放大的文章页。内容都是一致的,URL链接却不同。
3. 文章侧边栏扩展伸缩
比如:abc.com/sem/789.html与abc.com/sem/789.html/#
第一个是文章页,第二个是没有侧边栏的文章页。内容大致是一致的,URL链接却不同。
早期的Begin主题也存在这样的情况,后来与鸟叔沟通一番后,新升级的主题已经不存在这种情况。
4. 下载页面
比如:abc.com/sem/999.html与abc.com/sem/999.html/download
第一个是文章页,第二个是下载页。内容都是一致的,URL链接却不同。
四. 如何解决
1. 针对域名重复问题,最佳的方法是使用301重定向,请参考《301重定向》。
2. tag标签或其他页面造成的重复,方法①找网站开发人员实现301重定向到指定的某一URL链接上;方法②robots.txt禁止搜索引擎抓取,请参考《robots协议》;③. 使用canonical标签可以告诉搜索引擎重复页面中,哪个才是规范的网页,避免搜索结果中出现多个内容相同或相似的页面,请参考《canonical标签深入剖析》。
最后问你一个小问题:你喜欢看重复页面吗?相信很多人都会回答:不喜欢。那么搜索引擎蜘蛛也是一样的。所以,赶紧把你网站上的重复页面干掉吧!