
如何提高搜索引擎网页收录数?
这次教大家一个方法,怎么看百度蜘蛛的爬行日志?因为之前一直喜欢研究百度。下面我们来介绍一下,自从前年2月份来我研究百度收录的最终战果。
对于各位站长来说,百度的收录是关心的重中之重。了解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的。很多网站目前使用的都是虚拟空间,都能够提供日志。日志是指在网站根目录下的logfiles文件夹里面日期。txt文本文件有很多介绍通过http查看返回命令的那种办法来查看蜘蛛,这里就不介绍了。
现在更多的网站是没有提供可以通过软件来查看的日志格式。更多的是类似下面的日志格式,如下:
03:28:34 GET /goods.php 202.108.7.205 200 34696 390
第一 03:28:34 访问时间
第二 GET /goods.php 访问的页面 get表示获取
第三 202.108.7.205 访问网站的源IP
第四 200 成功访问
第五 34696 390 表示记录的内容大小
都是这种格式的日志如何去分析了,一个一个看的头都大了。北京礼品网站的日志记录每天都有1M多,上千条记录岂不是会看都头晕眼花。
注意了,告诉大家一个窍门。经过长期观察发现,百度的蜘蛛的来源服务器IP地址都是属于一个域下面的通个网段。什么意思了,就是全部都是以202.108开头的IP,IP地址都是类似于202.108.X.X。这个网段的IP地址是位于北京网通电报大楼,属于全国互联网核心骨干机房,现在此IP段已经绝迹了:基本上全被大网站使用了,如新浪、雅虎等。那么调出你的日志,用ctrl+f查找一下有没有这个网段的IP。有的话那这个就是百度蜘蛛的访问地址了,然后就查找一下访问的时间,那么就可以找出来百度蜘蛛访问你网站的时间规律了。

| 用户名: | 还不是我们网站会员吗?请点击 注册! |
| 对此评分: | 鼠标放在五角星上看看^_^,马上评分! |
| 验证码: |
|
| 内容: | |
|
|
| 注意: |
尊重网上道德,遵守中华人民共和国的各项有关法律法规,不发表攻击性言论, 承担一切因您的行为而直接或间接导致的民事或刑事法律责任, 新闻留言板管理人员有权保留或删除其管辖留言中的任意内容。 |