隨筆-26  評論-111  文章-19  trackbacks-0

          ??? 有些人說不知道snoics-reptile中的snoics-systemconfig.xml不知道怎么配置,這里就給出一個CSDN中Java文檔中心的抓取配置的抓取配置。

          ???? 在抓取完了之后往Apache的httpd.conf中加入
          Listen 10001
          <VirtualHost *:10001>
          ??? DocumentRoot D:\\temp\\reptile\\website
          </VirtualHost>
          ???? 這段配置。


          ???? 最后刪除抓取下來的文件夾中的D:\temp\reptile\website\author\index.html這個文件。不知道為什么文檔中心的這個URL是一個空的頁面http://dev.csdn.net/author? ,把這個URL的相對應(yīng)的抓取下的文件刪除就可以正常使用了

          ???? 在抓取的過程中,有些圖片文件可能會出現(xiàn)錯誤,不過不影響使用,因為這些圖片的路徑本身大概就有些問題。


          ????? 附件-配置文件:http://www.aygfsteel.com/Files/snoics/snoics-systemconfig.rar

          posted on 2006-08-19 14:30 snoics 閱讀(1571) 評論(0)  編輯  收藏

          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 清远市| 平塘县| 和林格尔县| 滦平县| 南投县| 邹平县| 宁夏| 三原县| 石楼县| 邵武市| 金寨县| 堆龙德庆县| 搜索| 澎湖县| 枣强县| 银川市| 旬阳县| 纳雍县| 六安市| 安仁县| 平舆县| 松滋市| 舒城县| 新丰县| 新干县| 泊头市| 桃源县| 鄂伦春自治旗| 左权县| 青阳县| 元江| 福建省| 桐梓县| 隆化县| 惠州市| 凤翔县| 石景山区| 江永县| 南江县| 万山特区| 天长市|