工具包系列(2):imageSpider工具——可定制的圖像抓取
摘要: 這個工具是一個可定制的圖像抓取工具我希望這個小工具的功能點有以下幾項:1.給定頁面抓取頁面的圖片;2.給定頁面和過濾規則,抓取頁面的圖片并存到本地磁盤或內存;
主要的技術點不多:1.圖片鏈接的獲取(htmlparser搞定);2.圖片的讀寫(imageIo搞定);3.規則的制定(來源于需求)
介于方法的多樣,第一個版本的spider只是很簡單的功能實現,未來希望加入的就是可擴展的規則對象
少廢話,上代碼:
閱讀全文
posted @ 2011-11-02 15:43 changedi 閱讀(2073) | 評論 (1) 編輯