小明思考

          Just a software engineer
          posts - 124, comments - 36, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          開源網(wǎng)絡爬蟲Snaker

          Posted on 2012-01-13 15:45 小明 閱讀(3244) 評論(1)  編輯  收藏 所屬分類: 開源項目
          最近開發(fā)的一個通用網(wǎng)絡爬蟲平臺,主要是想滿足自己想從特定網(wǎng)站抓取大量內(nèi)容的需求,有如下特點:

          1. 支持cookie/session,所以支持登錄論壇和網(wǎng)站
          2. 支持圖像識別,可以由人工識別或者機器識別
          3. 多線程下載,性能不錯
          4. 支持代理
          5. 支持HTTPS和證書驗證
          6. 支持可插拔腳本,對特別網(wǎng)站使用特別的腳本(javascript編寫)。
          7. 有Web界面,操作方便

          項目位置:http://code.google.com/p/ssnaker/
          下載:http://ssnaker.googlecode.com/files/snaker_1.00_b7.zip

          最新的版本也實現(xiàn)一個火車票刷票的功能(具體實現(xiàn)都放在engines/train.js)



          評論

          # re: 開源網(wǎng)絡爬蟲Snaker  回復  更多評論   

          2012-12-25 11:18 by 楊先生
          你好,我想和您商量關于爬蟲信息問題,謝謝。19093188

          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導航:
           
          主站蜘蛛池模板: 仁怀市| 萨嘎县| 宜昌市| 大洼县| 昌平区| 江孜县| 横峰县| 合水县| 南城县| 鲁山县| 东兴市| 邛崃市| 富宁县| 乡城县| 河池市| 滦平县| 文成县| 南宫市| 准格尔旗| 吕梁市| 隆尧县| 申扎县| 贡觉县| 桐城市| 霍城县| 金沙县| 闸北区| 高雄市| 民县| 邹城市| 台北县| 怀化市| 武乡县| 连城县| 黄梅县| 扶风县| 孟村| 溧水县| 平阴县| 泉州市| 榆树市|