百度蜘蛛是什么?

TAG: 时间:2013-07-26 00:00:00

   

    百度蜘蛛,英文名是“Baiduspider”是百度搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站设计的网页、图片、视频等内容。简单说就是百度爬虫或者称百度机器人,就是一个程序模拟蜘蛛一样在互联网上爬行,爬到你网站就说明来到你的网站了,那如何才可以知道百度蜘蛛来过呢?
    我们通过查询iis日志(如何设置iis日志及如何下载查看百度一下吧)中的baiduspider这个词 如果有就说明来攻,反之就是没有来过。
    附带说明一下状态码的含义:
    sc-status分以下几种情况--
    2xx 成功
    200 正常;请求已完成。
    201 正常;紧接 POST 命令。
    202 正常;已接受用于处理,但处理尚未完成。
    203 正常;部分信息 — 返回的信息只是一部分。
    204 正常;无响应 — 已接收请求,但不存在要回送的信息。
    3xx 重定向
    301 已移动 — 请求的数据具有新的位置且更改是永久的。
    302 已找到 — 请求的数据临时具有不同 URI。
    303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
    304 未修改 — 未按预期修改文档。
    305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
    306 未使用 — 不再使用;保留此代码以便将来使用。
    4xx 客户机中出现的错误
    400 错误请求 — 请求中有语法问题,或不能满足请求。
    401 未授权 — 未授权客户机访问数据。
    402 需要付款 — 表示计费系统已有效。
    403 禁止 — 即使有授权也不需要访问。
    404 找不到 — 服务器找不到给定的资源;文档不存在。
    407 代理认证请求 — 客户机首先必须使用代理认证自身。
    410 请求的网页不存在(永久);
    415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
    5xx 服务器中出现的错误
    500 内部错误 — 因为意外情况,服务器不能完成请求。
    501 未执行 — 服务器不支持请求的工具。
    502 错误网关 — 服务器接收到来自上游服务器的无效响应。
    503 无法获得服务 — 网页设计由于临时过载或维护,服务器无法处理请求。

 

 

 

北京网站建设 北京网页设计 网站制作(www.bjycxf.com



分享到:
YC & 原创官方微信
Contact Us & 联系我们

TEL: 010-68703788/66/87/89

地址:北京市海淀区大钟寺十三号院华杰大厦11B8室

© Copyright 2004-2014 bjycxf.com All Rights Reserved 版权所有

京ICP备09080439号 京公网安备11010802012755号