顶部右侧 | 自行修改 西安网站推广
当前位置:网站首页 > SEO技术 > 正文

教你看出日志中的隐藏的秘密

seo秀 2019-05-25 40 浏览 0 评论

几天前我通过自己工作室才上线的网站教大家通过服务器日志察看中蜘蛛的访问行为,相信这样一来大家都能举一反三的找出日志中不同搜索引擎蜘蛛的爬行路径了吧。今天我们仍用自己的网站服务器日志,教大家清晰掌握服务器与蜘蛛是怎么互动的,这些都是日志中不太明显的信息,需要你细心的去观察的。新站起用是用被使用过的老域名,反而没有直接用没有被使用过的新域名收录来得快,最近上线的这个新站,因为域名选取的原因,必须使用被使用过的老域名,上线已经9天, 仍没有快照与收录,但我们是不是就应该要选择放弃了呢?,好吧,我们仍拿出几条蜘蛛爬行记录来分析:,123.125.71.116 - - [10/Sep/2012:05:41:23 +0800] "GET / HTTP/1.1" 200 5858 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html),

几天前我通过自己工作室才上线的网站教大家通过服务器日志察看中蜘蛛的访问行为,相信这样一来大家都能举一反三的找出日志中不同搜索引擎蜘蛛的爬行路径了吧。今天我们仍用自己的网站服务器日志,教大家清晰掌握服务器与蜘蛛是怎么互动的,这些都是日志中不太明显的信息,需要你细心的去观察的。新站起用是用被使用过的老域名,反而没有直接用没有被使用过的新域名收录来得快,最近上线的这个新站,因为域名选取的原因,必须使用被使用过的老域名,上线已经9天, 仍没有快照与收录,但我们是不是就应该要选择放弃了呢?

好吧,我们仍拿出几条蜘蛛爬行记录来分析:

123.125.71.116 - - [10/Sep/2012:05:41:23 +0800] "GET / HTTP/1.1" 200 5858 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

通过上一次的讲解,我们知道IP为123.125.71.116的蜘蛛,在2012年9月10日凌晨05点41分23秒的时候,爬行了我们首页信息,HTTP返回状态值200,爬行字节数5858。

今天我们要重点讲解的就是这个HTTP返回状态值,什么是返回状态值?都有哪些返回状态值?它们都分别代表什么意思?

什么是HTTP返回状态值呢?当用户或搜索引擎向网站服务器发出浏览请求的时候,服务器返回的HTTP数据流中头信息中的状态码,它是一种服务器与访问者交互的语言。

都有哪些返回状态值呢?返回状态值有很多,根据其含义,以1开头的返回值表示临时响应并需要请求者继续执行操作。以2开头的返回值表示成功处理了请 求。以3开头的返回值要求完成请求需要进一步操作,通常这些状态码用来重定向。以4开头的返回值表示请求可能出错,妨碍了服务器的处理。以5开头的返回值 表示服务器在处理请求时发生内部错误,这些错误可能是服务器本身的错误,而不是请求出错。

好吧,纯粹的理论让人看得是不是有点头晕了,我们下面用实例来分析一下常见的返回状态值都有哪些!

背景:我们分析的这个网站是老域名,之前被人用过,存在搜索引擎收录数据,现在域名被我用来重新建站。

我们来几条记录来看一看:

123.125.71.98 - - [10/Sep/2012:01:02:33 +0800] "GET /news/disp.php?id=302 HTTP/1.1" 404 1107 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

这条记录HTTP返回状态值是404,原因是因为百度蜘蛛爬行了一条本网站根本不存在的路径,HTTP返回404代表:服务器找不到请求的网页。

123.125.71.116 - - [10/Sep/2012:05:41:23 +0800] "GET / HTTP/1.1" 200 5858 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

这条记录HTTP返回状态值是200,原因是因为百度蜘蛛爬行了真实存在的网站首页,HTTP返回200代表:服务器已经成功处理了请求。

220.181.51.113 - - [10/Sep/2012:08:44:22 +0800] "GET /product/disp.php?id=85 HTTP/1.1" 301 250 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

这条记录HTTP返回状态值是301,原因是因为百度蜘蛛爬行了在网站中不存在的文件路径,HTTP返回301代表:请求的网页已永久移动到新位置。

HTTP返回状态值还有很多,如果你遇到其它的可以随时百度一下就能找到它代表的意思。本文的目的是希望通过我们网站的文章,帮助到其他和我们遇到同样问题的人。目前本文新上线的网站大量存在HTTP返回状态404,主要原因是老域名存在使用情况,百度收录数据库中存在大量原有收录数据,现在百度蜘蛛仍按原收录文章路径进行爬行,导致HTTP返回状态值出现404码,根据笔者的经验,此时新站处于百度审核期,只有通过百度一个月到三个月的 审核期,收录数据才能得到释放,此时的404应该越多越好,蜘蛛爬行不通,自然会将该条原收录数据删掉,只是这样一来会延长新站的审核通过周期。

新站起用被使用过的老域名,就会遇到像我一样的情况,但是怎么观察隐藏在日志的访问秘密,是做为站长的你必须要学会的。只有这样,才能让你看到希望,只有这样,才能让你有坚持的动力,只有这样,才能让你不再疑惑!

好了,今天的分享到此结束,让我们拭目以待新站的成功收录吧!

原文出处:http://www.cdfei.com/experience/seo/seo-82.html

相关推荐

搜索引擎不收录网站页面的常见原因

  1、网页使用框架:框架内的内容通常不在搜索引擎抓取的范围之内。,  2、图片太多,文本太少。,  3、提交页面转向另一网站:搜索引擎可能完全跳过这个页面。,  1、网页使用框架:框架内的内容通常不...

网站优化:您的网站适合访问么?

  很为国内一些中小型企业抱不平,因为一些非专业的网络公司似乎愚弄了他们。在我看来企业的网站建设是一件很谨慎的事情,应该严肃认真对待,而这些网络公司帮助企业建立的网站往往是很不适于访问的。,  一些企...

SEO研究:百度的搜索排名原则

  百度是全球最优秀的中文信息检索与传递技术供应商,公司号称“全球最大的中文搜索技术提供商”。中国所有提供搜索引擎的门户网站中,超过90%以上都由百度提供搜索引擎技术支持,现有客户包括新浪、搜狐(ch...

执行seo项目时容易出现的八大错误

《执行seo项目时容易出现的八大错误》文章已经归档,不再展示相关内容,编辑建议你查看最新于此相关的内容:字节跳动旗下公司经营范围变更新增出版物零售、演出经纪业务据天眼查数据显示,4月...

搜索引擎优化:Title在seo中越来越重要

  Title是整个html在搜索引擎搜索结果中返回的第一要素,在目前为止,它被证明是seo效果中最为重要的一项之一,里面拥有最为核心的关键字词,下面是点石互动(www.dunsh.org)小鹏搜集到...

关于Google Sitemap的几点认识

  很多朋友刚步入SEO行业,可能是带着很多疑问的,比如:我的站排名为什么不太好?我的站的收录为什么这么少等。,  当你咨询一些SEOER时,他们也会教你一些措施,其中关于Google的收录就有一条G...

网站站长如何做好网站的搜索引擎优化

  搜索引擎优化(即SEO)是一项非常重要的基础性网站推广工作。它的原理是将网站按照搜索引擎自动收录的规则,将网站进行技术等相关处理,以便于网站能够快速有效的被搜索引擎收录。有统计表明,大多数网站的访...

SEO优化:关键字密度与网站排名

  经常会有很多搞搜索引擎优化的同行们问到关键字的问题。譬如:一个页面有多少个关键字或者关键字短语对于排名更有利;或者,一个页面关键字的密度是多少更有利于排名之类的问题。下面就我个人的经验谈一下对于关...

Google优化网站管理员指导方针

  遵照以下的这些方针对于让Google能发现、收录与排名都会有很大的帮助,也是一个确定你的网站能否出现在Google搜索结果里最好的方法。就算你选择不贯彻执行这些建议,但是我们强烈建议你关注我们的“...

如何让百度天天更新你、收录的更多

  只谈baidu——其他话题以后再谈,  最近做了几个垃圾站,从中体会到一点baidu收录的经验,今天我给大家谈谈!,  总看到不少的做站的人说,今天我的站收录了多少多少页,我的站多久被更新一次...

欢迎 发表评论: