网站收录是实际SEO过程中最重要的环节之一。这方面的技术文章在网络上几乎是饱和的,但几乎所有的文章都是站在网站本身的角度。经过几年的SEO实践,作者在思考搜索引擎抓取网页的方式时总结出了几种促进网站包容性的技巧,希望在此分享。
一般情况下,大多数人认为网页不收录的原因是网页质量差,原创性不够,或者外部链接少,不能说是错的。这些都只是站长片面思考的表面现象,是基于自己实际SEO知识推测的结果。SEO的传统知识是从结果中猜测原因。作者认为搜索引擎的爬行方法可以启发我们理解网站收录的规律。
首先,内容丰富的网站受到搜索引擎的青睐
互联网上每天都有成千上万的新页面,大站的新页面比小站的多。搜索引擎倾向于在页面较多的大站抓取页面,因为大网站往往包含的页面较多,质量较高,而搜索引擎倾向于先在大站抓取并收集页面。就是这样一个想法,在做SEO的时候提醒站长让网站出现更多的内容,丰富的网页会引导搜索引擎频繁抓取并收录,这是做SEO的一个长远规划思路。
其次,首先捕获并包含具有多个链接的高质量网页
搜索引擎通过网页之间的链接关系发现并抓取互联网上的网页。众所周知,链接是有投票功能的,投票越多,网页搜索引擎就越受关注,会优先抓取。Google提出的Pagerank算法可以根据链接关系给网页打分,决定网页URL的下载顺序。所以在SEO实战中,如果有网页收录,可以适当增加优质的外链,这里特别注意“优质”二字。换句话说,入口决定出口。如果搜索引擎在Hao123或者A5上找到了网站锚文本链接,比一个B2B网页锚文本链接更有意义。
第三,网页历史更新规律影响搜索引擎的抓取频率
搜索引擎的资源不是无限的,他们也在尽力节约资源。对于同一个网站,蜘蛛会根据网站的大小和更新频率来决定抓取的次数,尽可能用最少的资源完成网站更新策略。搜索引擎会假设过去经常更新的网页,将来也会经常更新。比如我们的网站如果每天晚上9点更新内容,经过一段时间的定期更新,蜘蛛默认会在这一点抓取内容,这样会提高搜索引擎的人气,更容易抓取并收录网页。
第四,用户体验策略对网站更新和收录的影响
最近在优化网站的时候,作者发现更新首页内容后,网站排名偶尔会下降,当快照莫名其妙的回到文件里,排名又会恢复。仔细分析了百度站长平台的关键词和流量,发现某个关键词在网站首页内容不变的情况下有一定的点击量。更新内容后,点击量下降,快照退了,排名又上升了。所以作者推测百度在抓取和记录内容时会适当考虑用户体验,网站的点击量从侧面反映用户体验。