您当前的位置: 首页 > 历史

百度蜘蛛状态码与百度快照湜否洧关系7z7

2018-01-11 17:04:38

做站有大半年了,今天第一次写这类文章。至于为什么要写这篇文章,是因为2009年下半年以来一直到现在,百度经常不正常,导致很多站长的站出现快照不更新,快照回档,甚至被K的现象。所以在A5论坛和seowhy论坛上经常看到有些站长说,希望百度能尽快更新自己的快照。其实快照第二天是否更新,不一定要寄希望于他人,只要自己查查web日志,就能知道。也就是我今天要跟大家说的话题。

下面我就简单的谈一下关于百度蜘蛛访问站后,web日志所返回的状态码与首页的百度快照是否会更新之间的关系,所谈到的都是小弟大半年以来每天观察自己站的web日志里百度蜘蛛的爬行痕迹所摸索出来的规律

百度蜘蛛状态码与百度快照湜否洧关系7z7

,希望对大家有些帮助。

大家可以尝试着打开web日志的.log文件,web日志的默认路径是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虚拟主机的朋友可以找空间商索要。打开文件夹下的.log文件,搜索百度蜘蛛,百度蜘蛛的名字为baiduspider。然后一直Enter,可以查出百度蜘蛛访问站后留下的所有足迹。在查找中,注意一下百度蜘蛛名字前面的IP,还有整行最后的状态码。

一般情况下,蜘蛛抓取页如果返回200 0 0代码,则表示该页已经成功编入索引,200 0 64是指索引数据库已经存在,没有发现页有更新的内容,不需要重新索引的意思。304 0 0是指原来缓冲的文档还可以继续使用,跟200 0 64意思应该差不多吧。 (值得一提的是:200 0 64并不是上很多人说的会被K站或降权,是正常现象,动态站抓取的时候大多数出现200 0 0,即便是站没有更新。)

在说一下蜘蛛IP,我的web日志里查到的蜘蛛IP一般都是220*,这三个段的IP是抓取页的,123.125.68.*这个段的是百度沙盒蜘蛛IP。61.135.168.*这个段的蜘蛛是抓取图片的。不过百度蜘蛛应该还有很多,可能是按照站的地区和线路发放蜘蛛的吧。具体情况还要具体对待。不过有一点可以肯定的是,在站没被降权的情况下,只要有两个IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*这两个段)都抓取了站首页且返回的状态码是200 0 0,那就不用每天等到零晨四点看百度更新首页的快照了(我以前经常等到凌晨四五点才睡觉,呵呵,不过现在一般都是在早上六七点才更新快照)。

一般百度首页快照比较慢、站权重比较低或者被降权的站,蜘蛛一般都是返回的200 0 64的状态码。我有一个被K过的站,当时每天都只有123.125.68.*这个段的IP,且状态码都是返回的200 0 0。

本文由热血传奇私服 站长原创,首发于admin5,转载请保留链接,谢谢!

南京专业治疗癫痫医院
北京瑞兰玻尿酸价格是多少
怀化哪家医院治疗癫痫病最好
睡觉时发作癫痫的原因
大众宝来4s店保养多少钱
推荐阅读
图文聚焦