新手可以快速入门网站日志分析

��Դ��未知

��ߣ�老铁SEO

��18

2018-11-07 00:57:46

　　网站日志分析工作对老站长来说是非常容易的，从日志代码的查看到日志分析出的问题解决是了如指掌。其实网站日志分析不难，只是新手不了解其中的意思，才会觉得有问题。慢慢看多了网站日志你也就懂了其中的意思。这里我以幸运赛车网站的日志为例，交新手如何快速入门这项工作。

　　其实代码没大家想象的那么难，当初我刚做彩票网站的优化工作，接触代码，我真觉得那些站长在好牛啊，这么难的幸运赛车网站日志代码都看得懂，崇拜之情无以言表。在看了一段时间网站日志后，才发现原来不是他们牛，是我还是菜鸟。自己摸索的话，对网站日志分析入门时间会比较久，在这里分享些经验，相信对于新手可以快速入门的。

　　1、蜘蛛名称介绍

　　在网站日志中，蜘蛛名称一般有一下几类：百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider 。在日志中，只要搜索以上蜘蛛名称，就可以看到该蜘蛛类型的爬取痕迹。

　　2、蜘蛛爬取返回类型

　　在蜘蛛爬取后会返回代码，通过查看贷款状态可以看到爬取结果，主要HTTP状态码有一下几类：

　　(1)200代码，表示蜘蛛爬取正常。

　　(2)304代码，表示自从上次抓取后，该内容没有更新。一般情况下，网站的图片经常会返回该值。

　　(3)404代码，访问的这个链接是错误链接。这个错误链接，一方面来自原本存在后来删除了网页，另一方面可能来自本来就不存在，但其他人外链了这么个死链接。

　　(4)302代码，表示临时重定向。

　　(5)301代码，表示永久重定向。

　　(6)500代码，表示程序有错。

　　3、日志代码解读

　　#Software: Microsoft Internet Information Services 6.0

　　#Version: 1.0

　　#Date: 2013-12-22 16:00:39

　　#Fields: date time s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs-version cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken

　　date表示记录访问日期;

　　time访问时间;

　　s-sitename表示你的虚拟主机的代称。

　　s-ip访问者IP;

　　cs-method表示访问方法，常见的有两种，一是GET，就是平常我们打开一个 URL访问的动作，二是POST，提交表单时的动作;

　　cs-uri-stem就是访问哪一个文件;

　　cs-uri-query是指访问地址的附带参数，如asp文件?后面的字符串id=12等等，如果没有参数则用-表示;

　　s-port 访问的端口;

　　cs-username 访问者名称;

　　c-ip 来源ip;

　　cs(User-Agent)访问来源;

　　sc-status状态，200表示成功，403表示没有权限，404表示打不到该页面，500表示程序有错;

　　sc-substatus 服务端传送到客户端的字节大小;

　　cs–win32-statu客户端传送到服务端的字节大小;

　　具体案例分析：

　　2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

　　这段日志表示，Baiduspider：表示蜘蛛爬取类型为百度蜘蛛，GET /a.aspx id=2230&TypeId=91表示蜘蛛爬取文件名为a.aspx id=2230&TypeId=91。返回结果为200。

上一篇：如何让网站快速被收录呢?

下一篇：网站搜索引擎优化几件重要事情