用一句话来概括网站收录和网站索引的关系和区别:
网站先收录后索引,网站收录量大于索引量。
网站收录就是与互联网用户共享网址,网站收录前提是网站首页提交给搜索引擎,蜘蛛才会光顾,每次抓取网页时都会向索引中添加并更新新的网站,站长只需提供顶层网页即可,不必提交各个单独的网页。抓取工具能够找到其他网页。符合相关标准提交的网址,会在1个月内按搜索引擎收录标准被处理。
网站索引量,就是搜索引擎抓取层层筛选后选取的页面数量!站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。
百度官方给出的收录和索引关系图已经很清晰明了了。
那么网站收录和索引分别指什么呢?
网站收录其实是指网站页面被Baiduspider发现、分析过,经过这一步,百度蜘蛛会初步分析出其中有意义的页面建立索引库存档,这一步就是索引。
所以我们可以很明显的看出来:收录和索引其实是承前启后的包含关系。网站页面只有先收录了,才能够建立索引,收录量是肯定会大于索引量的,因为任何的网站都会有一些已经收录的内容并没有达到建立索引的程度。
在网站收录是网站索引的前提下,我们的站点需要保持服务器的稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),这样才能让百度蜘蛛抓取网站页面更加顺利。
但是百度蜘蛛只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换。
同时,只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)。那么我们可以获得的启示是:需要尽量提高网页的质量度。
文章来源:运营聚焦。
评论