Skynet

          ---------- ---------- 我的新 blog : liukaiyi.cublog.cn ---------- ----------

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            112 Posts :: 1 Stories :: 49 Comments :: 0 Trackbacks
                各位“蜘蛛俠”們大家可能在抓取頁面中的驗證碼而耿耿于懷,關于這點我想我目前可能能幫助下大家,在python中找到最接近與“殺手級別”的工具(源于開源,報與開源,好東西不干獨享)。


          調下大家的積極性 ,上圖



          python 包>> pytesser| http://code.google.com/p/pytesser/(其實 py包 使用很簡單的,關鍵在安裝)
          1. 首先安裝 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
          2. pytesser 依賴包 tesseract-ocrhttp://code.google.com/p/tesseract-ocr/  
                       tesseract-ocr 依賴庫| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解壓到 你安裝的 tesseract-ocr 的 識別學習庫下



          整理 www.aygfsteel.com/Good-Game
          posted on 2009-03-27 10:21 劉凱毅 閱讀(3235) 評論(3)  編輯  收藏 所屬分類: pythonimage

          Feedback

          # re: 驗證碼識別(2) 2009-03-27 15:31 .........
          這個不錯.不知道復雜的圖片識別怎么樣?  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-03-27 17:13 hwx
          還行哦,雖然識別碼簡單。我以前公司要用這些都是找人買的  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-07-11 09:41 wangdong
          呵呵,復雜的圖片可以進行前端處理,比如二值化,中值濾波等等,處理成黑白的圖片后再交給tesseract識別,不過對于背景色和字符色差不多的那種處理要麻煩一些  回復  更多評論
            

          主站蜘蛛池模板: 台中县| 威远县| 那曲县| 罗田县| 盐池县| 彭水| 双城市| 乐安县| 宿州市| 公主岭市| 三门峡市| 盖州市| 文山县| 宁海县| 渭南市| 东台市| 新兴县| 紫云| 乌兰察布市| 富裕县| 垫江县| 哈密市| 宽甸| 如皋市| 建昌县| 上栗县| 平度市| 驻马店市| 绵阳市| 罗定市| 临沭县| 来安县| 襄汾县| 承德县| 体育| 龙里县| 什邡市| 交城县| 福泉市| 安溪县| 丰宁|