如何提高目录页面的收录量

目标:提高目录页面的收录量

分析:通过前面一篇文章提到的有关收录的两个因素,我们需要检查一下,网页是否被spider爬行过,网页内容的质量是不是过关。

1. 关于spider的情况,我们需要分析网站日志,才能确定。于是我们从网站日志中拆分一系列数据看看页面是否真的被爬行过。

2. 由于页面内容质量似乎是一个很难衡量的值,于是我们可以用相同模板下的。

已被爬行的页面数量/已被爬行并且被收录页面数量

来评估该模板页面质量对收录的影响大小。如果被爬的页面都被收录了,那至少说明这套页面的内容搜索引擎还算认可。

评估:

先看一下网站日志的情况,通过Shell脚本,我们可以分析出。

目录总计被爬行的次数为13000次左右

不重复的目录爬行次数为5500次左右

频道A下的目录几乎被100%抓取过至少1次,频道B的目录抓取也不错,有70%被至少抓过一次。

其余频道下的目录被抓取的覆盖率不到30%

日志数据

不要觉得这个结果很神奇,其实很多网站都会面对这样的糟糕问题,只要你把数据不断的细分,细分,再细分,总会观察出一些端倪的。

关于网站日志分析,不要迷信任何的网站日志分析软件,那都是给懒人用的,自制脚本+Excel才是王道,可以拆分显示出任何你想要的数据,当然,甚至可以连Excel都不要。

然后,我们统计了一下被抓得最频繁的频道A和频道B,目录页的收录率

目录页的收录率

频道A和B是很让人放心的,说明页面质量没问题,但是余下的收录情况就让人比较担心了。

决策:通过上面的数据评估,我们已经得到了如下结论。

页面质量并不是影响收录的原因。

频道A,B的抓取量异常的高,通过调查了解,原来是首页上的目录页,显示的全是频道A下的目录页,首页又拥有全站最高的权重。频道B拥有比其他频道强大的外链资源,权重也非常高。

除了A, B频道,其他频道的抓取情况不容乐观,抓取入口太少,太深,进而影响了收录情况。

很明显,现在频道A从站内的角度来说太强大了,必须进行一些“劫富济贫”的运动来降低频道A的抓取量,转移到其他频道中去。同时,需要给spider提供更多的入口抓取频道页。

yiguochun

yiguochun(http://blog.0660hf.com/)0660SEO博客是以seo网站优化,Seo学习,sEO知识,SEO网络推广技巧及站长分享经历的媒体博客,为SEO爱好者和广大站长提供一个SEO案例分享和交流的平台,从分享SEO分享交流过程中带来更多的心满意足。

You may also like...

发表评论

电子邮件地址不会被公开。