狂淘

          www.kuangtao.net

             :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
            6 隨筆 :: 185 文章 :: 68 評論 :: 0 Trackbacks

          百度用于抓取網頁的程序叫做Baiduspider - 百度蜘蛛,我們查看網站被百度抓取的情況主要是分析,網站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態碼。

          查看日志的方式:

          通過FTP,在網站根目錄找到一個日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網站的日志,記錄了網站被訪問和操作的情況。

          因為各個服務器和主機的情況不同,不同的主機日志功能記錄的內容不同,有的甚至沒有日志功能。

          日志內容如下:

          61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"   

          分析:

          GET /bbs/thread-7303-1-1.html   代表,抓取/bbs/thread-7303-1-1.html 這個頁面。

          200  代表成功抓取。

          8450  代表抓取了8450個字節。

          如果你的日志里格式不是如此,則代表日志格式設置不同。

          很多日志里可以看到 200 0 0和200 0  64 則都代表正常抓取。

          抓取頻率是通過查看每日的日志里百度蜘蛛抓取次數來獲知。抓取頻率并沒有一個規范的時間表或頻率數字,我們一般通過多日的日志對比來判斷。當然,我們希望百度蜘蛛每日抓取的次數越多越好。

          在網站出現問題的情況下,通過查看網站日志,查看網站的HTTP返回值是否正常,這篇文章總結了常見的HTTP返回值:
          www.kuangtao.net 狂淘購物網

          posted on 2010-05-25 12:15 狂淘 閱讀(167) 評論(0)  編輯  收藏 所屬分類: SEO
          主站蜘蛛池模板: 华容县| 石嘴山市| 山西省| 鹤山市| 辰溪县| 东山县| 闻喜县| 涪陵区| 大冶市| 镇巴县| 静乐县| 龙南县| 凯里市| 桃园市| 饶阳县| 正定县| 焉耆| 阿荣旗| 黄山市| 泗水县| 彝良县| 清远市| 永泰县| 青岛市| 中牟县| 勃利县| 呼图壁县| 大兴区| 剑川县| 肥城市| 永昌县| 通江县| 新沂市| 八宿县| 武义县| 独山县| 新绛县| 乐业县| 米脂县| 靖边县| 正定县|