404页面会被搜索引擎收录吗?

今日看到问答里有人在讨论404页面会被搜索引擎收录吗?关于这个话题,小伙伴们的看法都不统一,有人认为会被收录,也有人认为不会被收录。那么,本篇文章同大家一起深层次思考“404页面会被搜索引擎收录吗”?下面谈一谈个人的看法。

404页面会被搜索引擎收录吗?

404页面会被搜索引擎收录吗?

我们所说的404页面具体是指什么?

404页面是客户端在浏览网页时,服务器无法正常提供信息或无法应答,或不知道原因所返回的页面。404页面存在的目的就是为了告诉搜索引擎和用户,这个页面出现了错误或已经不存在了。

404页面真的会被搜索引擎收录吗?

其实404页面分为两种情况:一种是软404,会在返回的页面中标明目标网页不存在,返回的状态码是200;另一种是硬404,返回的状态码是404,这才是真正意义上的404页面。

不清楚状态码的小伙伴请阅读《HTTP状态码(SEO优化人员必须知道的)》。

404页面会被搜索引擎收录吗?

有的小伙伴们说:404页面会被搜索引擎收录。

据May分析,出现这种现象很有可能是以下原因:

1. 已经收录过的页面被删除后出现的404,是因为该网页还未被搜索引擎检索到;

2. 很有可能是404页面返回的状态码是200,这相当于是在告诉搜索引擎这是一个真实的网页,因此该网页可能会被搜索引擎收录并列在搜索结果中。这其实是一种非常不好的做法,搜索引擎一直在抓取这个没有意义的网页,将时间花费在这些毫无价值的网页上,甚至很有可能会产生大量的重复的404页面。那这类404页面该如何正确处理呢?

①. 不存在的网页或已删除的网页,应返回404(未找到)或410(已删除)响应代码,明确告知搜索引擎:该网页不存在。当然还可以向用户显示自定义404页面,引导用户返回首页或其他栏目页;

②. 已移动的网站或有明确的替换网页,最佳的做法是使用301重定向到指定的网页;

③. 本应返回404状态码却被错误地标记为软404的页面,检查网站程序或404设置或咨询网站开发人员。

也有的小伙伴们说:404页面不会被搜索引擎收录。

是的,真正返回404状态码的页面,也就是搜索引擎明知道是死链,是不会被收录的。

也有小伙伴问:需要在robots协议中设置disallow: /404.html吗?

May个人认为:只要404.html页面返回的状态码是404,就不会被搜索引擎收录,完全没有必要再多此一举。

以上,完全是May的个人看法。如果您有不同的看法,也欢迎您在评论区留言参与讨论。

 


【AD】BandwagonHost:$92.30/年/2核/2G内存/40G SSD/1T流量/1Gbps/香港CMI/大阪软银/洛杉矶CN2 GIA

【AD】美国洛杉矶CN2 VPS/香港CN2 VPS/日本CN2 VPS推荐,延迟低、稳定性高、免费备份_搬瓦工vps