首先在谈百度对站点新发布内容快速收录问题上,给大家说下百度对站点收录抓取原理,方便大家更好的理解。
关于百度的收录问题
很多朋友在论坛里发帖说自己的网站看了IIS日志后有被百度蜘蛛爬过但是没有收录的问题,这跟百度的搜索引擎的原理是有关系的。
首先,搜索引擎会建立一个网页地图(Webmap),记录互联网的链接结构,再使用网页抓取程序(Robot)根据网页地图来抓取(Crawl)质量好的网页,存储到网页快照数据库中。然后,索引程序(Indexer)会将快照数据库中的网页编号存储到网页索引数据库中,在这个过程中,会利用相关技术去掉作弊网页(Spam)。当用户输入一个查询词搜索时,查询程序会使用这个查询词到索引数据库中比较,经过相关性计算后,按照相关程度对网页进行排序,相关性越高的排得越靠前。相关性的计算是包括各种因素的综合结果,例如:网站建设的标题或网页设计的内容对查询词的匹配、网页被链接的次数等。所以大家只要耐心等待搜索引擎的下次更新就可以看到自己的页了。
同时百度对新内容收录问题还出现这样情况:“如果之前做了竞价的,现在不做了。但是不做了以后,百度就没有收录了”。
这个问题曾经有SEOer问过百度的工作人员,他们是这样说的:
1、如果你之前做过,但如果用作弊行为,即使在做竟价也不会被百度收录了。
2、如果你做竟价,停掉后,收录也没有了,说明你做的时间短,他们说如果做半年以上是一定可以收录的,但我不相信他们这样说。还要看你自己站点的情况,是新站,还是老站,是一直都没收录,还是收录过,根据具体情况做分析。
北京网站建设 北京网页设计 网站制作(www.bjycxf.com)