做网站,尤其是新站,毫无疑问得每天检测网站的日志情况,看一下每天是否有蜘蛛过来爬行,这很重要!这几次查看新站星战风暴的时候,总是发现有成对的百度蜘蛛出现,不知道这是怎么回事?如下表所示:
1227021244 / HTTP/1.1 GET Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html) [] 123.125.71.59 1227021312 / HTTP/1.1 GET Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html) [] 220.181.108.92
希望高手能给指导一下,我只知道123.123.71.* 这个ip如果来的话,表示权重比较低。220.181.108.* 是高权重ip。关于百度蛛蛛ip大家可以参考一下这篇文章:http://blog.sina.com.cn/s/blog_693852bb0101ieh2.html
从来不关心百度蜘蛛~~~
呵呵, 这个东西主要是对新站来说,还是就是降权的站。
新年快乐.
不同IP对应不同的权重这个结论的寻找实在是太细心了.不过想想的确爬虫是应该这么写的.
这是日志里面的东西,百度不爱了。
还有这个说法,学习了~
大神果然NB=-=我从来没发现个我网站有搜索引擎的蜘蛛=-=
这个要看网站的日志才行。。。