首页 详谈百度收录过程

详谈百度收录过程

举报
开通vip

详谈百度收录过程详谈百度收录过程 详谈百度收录过程2010年03月11日星期四12:47关于百度收录问题,网上有很多的相关介绍,说得百度是天花乱坠,有说百度好的,也有抱怨百度的,甚至有的还大骂出口。呵呵,我个人认为百度是中国个人BaiduSpider"。比如:2008-07-15 00:13:54 W3SVC 818374 222.214.218.36 GET/index.html-80-221.10.254.26 Baiduspider(200 00 265。当你把网址如:www.bbxyx.com提交到百度后,"百度蜘蛛"...

详谈百度收录过程
详谈百度收录过程 详谈百度收录过程2010年03月11日星期四12:47关于百度收录问题,网上有很多的相关介绍,说得百度是天花乱坠,有说百度好的,也有抱怨百度的,甚至有的还大骂出口。呵呵,我个人认为百度是中国个人BaiduSpider"。比如:2008-07-15 00:13:54 W3SVC 818374 222.214.218.36 GET/index.html-80-221.10.254.26 Baiduspider(200 00 265。当你把网址如:www.bbxyx.com提交到百度后,"百度蜘蛛"就会在网络低潮时刻来访你的站点,大概是一天索引50条信息左右。IIS日志中可以查看到"BaiduSpider"的访问痕迹,其中主要的有cs-uri-stem(URI资源)、cs(User-Agent)、sc-status(协议状态)。cs-uri-stem(URI资源)记录被访问的文件名称及路径。cs(User-Agent)对应一栏中则可以看到来访者相关信息,如果是"百度蜘蛛"则显示有"BaiduSpider"字样。sc-status(协议状态)记录着的数据主要有三个:200(成功访问)、304(已索引或未更新)、404(访问失败)。当你的网站的某条数据有被"百度蜘蛛"访问过,并且sc-status(协议状态)显示的数字为200(成功访问),那么你的这条信息就已经成功的被收录了。如果sc-status(协议状态)显示的数字为304(已索引或未更新),就表示这条数据已经存在了。如果是404(访问失败)就说明蜘蛛无法成功访问这条信息,这样你就应该检查一下路径了。 好,现在我简单的给大家说一下百度的收录程序:蜘蛛来访索引--蜘蛛携带已访问到的数据返回--百度服务器判断数据并且返回信息--数据入库。 当数据成功入库之后就表明已经成功收录了,但为什么在百度的搜索引擎里找不到呢?因为百度收录了你的数据后不会马上就给你放出来,要经过一系列的审核过程,当审核通过了才能在搜索引擎中出现。 说到这里也许有朋友会问?百度的审核过程也太漫长了吧?我的一个新站近一个月后才出现在百度搜索引擎中,有的甚至要两个月。据我理解,当你的网站所有数据被百度收录到有70%左右的时候百度才开始审核你的数据。以一天收50条数据量来计算,1000条数据若要等收录到700条左右才开始审核,那么也要近半个月的时间。所以这就是为什么有些网站需要一个月,有些网站需要两个月了。 以前有很多朋友问过我这样一个问题:比如我是这个月1号提交网址到百度,等到20号的时候百度的搜索引擎中出现了我的网站索引。但是百度快照旁边显示的时间是3号的,这是为什么呢? 其实当你了解了百度的收录过程后就不难理解这个问题了,百度快照旁边显示的时间正是这条信息的收录或者更新时间,刚才已经讲过,只要蜘蛛成功访问到的信息就是已经收录了。而搜索引擎中显示的时间就是这条信息从蜘蛛索引到入库的时间。 好了,以上就是我个人认为的百度收录过程了。
本文档为【详谈百度收录过程】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_654168
暂无简介~
格式:doc
大小:12KB
软件:Word
页数:0
分类:生活休闲
上传时间:2019-01-09
浏览量:3