Skynet

          ---------- ---------- 我的新 blog : liukaiyi.cublog.cn ---------- ----------

            BlogJava :: 首頁 :: 聯(lián)系 :: 聚合  :: 管理
            112 Posts :: 1 Stories :: 49 Comments :: 0 Trackbacks
                各位“蜘蛛俠”們大家可能在抓取頁面中的驗證碼而耿耿于懷,關(guān)于這點我想我目前可能能幫助下大家,在python中找到最接近與“殺手級別”的工具(源于開源,報與開源,好東西不干獨享)。


          調(diào)下大家的積極性 ,上圖



          python 包>> pytesser| http://code.google.com/p/pytesser/(其實 py包 使用很簡單的,關(guān)鍵在安裝)
          1. 首先安裝 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
          2. pytesser 依賴包 tesseract-ocrhttp://code.google.com/p/tesseract-ocr/  
                       tesseract-ocr 依賴庫| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解壓到 你安裝的 tesseract-ocr 的 識別學習庫下



          整理 www.aygfsteel.com/Good-Game
          posted on 2009-03-27 10:21 劉凱毅 閱讀(3240) 評論(3)  編輯  收藏 所屬分類: pythonimage

          Feedback

          # re: 驗證碼識別(2) 2009-03-27 15:31 .........
          這個不錯.不知道復(fù)雜的圖片識別怎么樣?  回復(fù)  更多評論
            

          # re: 驗證碼識別(2) 2009-03-27 17:13 hwx
          還行哦,雖然識別碼簡單。我以前公司要用這些都是找人買的  回復(fù)  更多評論
            

          # re: 驗證碼識別(2) 2009-07-11 09:41 wangdong
          呵呵,復(fù)雜的圖片可以進行前端處理,比如二值化,中值濾波等等,處理成黑白的圖片后再交給tesseract識別,不過對于背景色和字符色差不多的那種處理要麻煩一些  回復(fù)  更多評論
            

          主站蜘蛛池模板: 双桥区| 中山市| 金平| 山西省| 若尔盖县| 阆中市| 闽侯县| 澜沧| 金阳县| 左云县| 大余县| 江门市| 紫阳县| 通州市| 凤冈县| 巴中市| 阿坝县| 无锡市| 桂东县| 正安县| 黔西县| 榆树市| 满洲里市| 克什克腾旗| 邵东县| 丁青县| 衡南县| 长宁区| 建湖县| 民乐县| 华蓥市| 修文县| 信阳市| 南汇区| 思南县| 顺义区| 武穴市| 广宗县| 三门县| 盐源县| 高台县|