SEO秀

您现在的位置是:首页>SEO技术

SEO技术

什么是网站日志?什么样的场景下需要网站日志剖析

seo秀2021-04-06 10:48:00SEO技术98来源:西安百度推广

什么是网站日志

什么是网站日志

什么是网站日志?什么样的场景下需要网站日志剖析

网站日志对于网站建设的作用相当于监控摄像头对我们的房间,它可以纪录下来,这一段时间内里所有的访客到我们家来接见的这个纪录。

什么是网站日志?什么样的场景下需要网站日志剖析

那我们一个网站天天有许多的用户来接见,同时天天另有许多的搜索引擎的蜘蛛来抓取日志,网站日志就能够把所有访客接见的情形,它用什么浏览器,什么操作系统,什么时间点来接见,接见了哪些页面?日志能够把这些数据所有纪录下来。

同时呢搜索引擎的蜘蛛过来抓取,它是百度的搜索引擎的蜘蛛,照样google的照样360的?他们过来抓取,划分是什么时间点抓取的哪些页面,抓取的时刻返回值是什么?是正常打开照样打不开,所有这些数据都能够纪录到一个叫做日志的一个文件里。

网站日志怎么剖析

1.网站日志下载及数据解读

剖析网站日志,我们可以领会搜索引擎蜘蛛来到我们网站接见的时刻,它获取到的信息是什么?网站跟搜索引擎之间它是什么样的一个对话,那网站日志怎么举行剖析,从那里下载到这个数据?

通过FTP接见网站的根目录。可以看到一个包罗log的文件夹,这是存放日志的地方。

若何查看网站日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 ndash; ndash; [11/Jan/2009:04:02:45 +0800] ldquo;GET /bbs/thread-7303-1-1.html HTTP/1.1rdquo; 200 8450 ldquo;-rdquo; ldquo;Baiduspider+(+http://www.baidu.com/search/spider.htm)rdquo; (注:百度,这部分为本文添加)

203.208.60.43 ndash; ndash; [11/Jan/2009:04:02:43 +0800] ldquo;GET /sns/space-13563-do-friend-view-me.html HTTP/1.1rdquo; 200 5162 ldquo;-rdquo; ldquo;Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)rdquo; (注:Google)

202.160.178.21 ndash; ndash; [11/Jan/2009:04:02:44 +0800] ldquo;GET /sns/space.uid323 HTTP/1.0rdquo; 200 7535 ldquo;-rdquo; ldquo;Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)rdquo; (注:雅虎)

65.55.220.217 ndash; ndash; [11/Jan/2009:04:02:57 +0800] ldquo;GET /ucenter/avatar.uid12373amp;sizesmallamp;typevirtual HTTP/1.1rdquo; 301 ndash; ldquo;-rdquo; ldquo;msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)rdquo; (注:MSN)

65.55.109.46 ndash; ndash; [11/Jan/2009:04:02:57 +0800] ldquo;GET /sns/source/script_menu.js HTTP/1.0rdquo; 200 7219 ldquo;http:/sns/space-5755-do-blog-view-me.htmlrdquo; ldquo;Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)

也许就是上面这样密密麻麻的代码,然则这些代码怎么明了呢。比较好明了,我们看一下这一串日志的内容。前面这个ip代表今天来接见我们的网站,它是什么ip?是用户呢照样搜索引擎蜘蛛它都有一个ip,就是把他的ip纪录下来。后面这个是一个时间点,什么时间来接见我们的网站?然后呢get就是抓取,抓取的哪一个文件呢抓取了这个文件。

就是我们的域名下面的wwwxx.com/BBS什么什么,把这个文件抓取回去。抓取回去之后呢200,这是http状态码,它代表抓取乐成,然后后面这个数字代表抓取了多少个字节?那200,然后这个8000多就是代表乐成抓取了8000多个字节,也就是我们一个网页的也许的巨细。那后面这一段就是代表蜘蛛,Baidu Spider就代表百度的蜘蛛,那这一句就代表这个内容是百度蜘蛛过来抓取,乐成抓取了这么多个字节。

好,那我们再看这个上面就可以看出这个是谁的蜘蛛,yahuspider这是雅虎的它是这个时间点。然后这上面是谁的呢?google的,对吧?最下面看一下,内里没有看到这是哪一个详细的搜索引擎。那它是谁?你看这个有MSIE6.0。这就说明微软的ie6.0,这是一个用户在来抓取和接见的一个页面。

以是日志它就这样的一个文件,把天天时时刻刻用户和蜘蛛来抓取我们网站的所有的情形,把它纪录下来。

2.剖析网站日志工具是什么

这个日志文件,内里看起来密密麻麻的,异常的费劲。一样平常人是没法看明了的。而且若是我们的网站的接见量异常大的话,那这个日志往往会有几十兆几百兆甚至几个G的这个巨细。那我们在电脑上打开的时刻,有的时刻电脑都市卡死掉。那么就会用到网站日志剖析工具。

一样平常剖析网站日志我们用光年日志工具剖析.关于这个工具的使用,人人可以看一下这篇://jingyan.baidu.com/article/15622f240a2e6afdfcbea58a.html百度履历领会一下,也可以去搜外的网站上看一下有免费的教程。

3.网站日志剖析http状态码的解读

那适才我们看这个日志的时刻,看到内里有一些适才提到一个词叫做http状态码,有看到200或者404,这个叫做HTTP状态码。

那这个http状态码,就是代表搜索引擎蜘蛛或者用户来接见我们网站的时刻,它是什么样的一个状态?什么样的一个情形?200就代表乐成抓取了,若是是404就代表过来抓取这个链接, 然则这个链接不存在,以是它就返回404。那状态码一样平常有200或者404,或者500等等这样的几个常见的数字,

我们不用领会稀奇多,只要也许的知道这么几个数字代表什么?200代表乐成抓取,404代表错误链接,500代表服务器出问题了,也许领会这么几个数据就可以了,不需要把所有的都记着。那若是想要领会更多http状态码的这个知识的话,可以在百度上搜索一下,就可以查询到所有这些代码划分代表什么意思?

什么样的场景下需要网站日志剖析

那么对于一个职业网站优化职员日志剖析的能力是必须要掌握的。那什么样的场景下需要日志剖析,下面我们看一下.

1.比如说我们创建了一个网站,提交给搜索引擎,厥后很长时间没看到搜索引擎的收录,那这个时刻我们就需要下载日志来剖析一下,看搜索引擎到底有没有过来抓取。

2.我们网站原来可能排名很好, 厥后突然间发现异常了,那我们就需要把日志下载下来看一下搜索引擎这段时间过来抓取我们网站的时刻, 它是不是有一些异常情形。

3.网站若是被人攻击或者入侵,那也要下载一下网站日志来剖析我们这个问题出在什么时间点,什么地方?

做网站日志剖析,我们接纳的一个方式一样平常是对比法, 就是我们网站和排名都正常的情形的日志, 和现在出问题的时刻的日志,拿出来举行对比, 接纳光年日志剖析,把这个数据拿出来看一下,看问题出在哪一个目录,或者说哪一些页面, 然后再去针对性的去研究一下。

(责任编辑:网络)

发表评论

评论列表(9人评论 , 98人围观)
  • 2021-04-23 04:54:58

    心灵鸡汤是给吃惯了鲍参翅肚的人做的换口味小菜,屌丝以为喝一碗鸡汤就营养全面提升了?

  • 2021-04-06 16:37:08

    大老远看到我一直盯着你时,不要觉得我对你有意思,我真得看不清你是谁。