Skynet

          ---------- ---------- 我的新 blog : liukaiyi.cublog.cn ---------- ----------

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            112 Posts :: 1 Stories :: 49 Comments :: 0 Trackbacks
                各位“蜘蛛俠”們大家可能在抓取頁面中的驗證碼而耿耿于懷,關于這點我想我目前可能能幫助下大家,在python中找到最接近與“殺手級別”的工具(源于開源,報與開源,好東西不干獨享)。


          調下大家的積極性 ,上圖



          python 包>> pytesser| http://code.google.com/p/pytesser/(其實 py包 使用很簡單的,關鍵在安裝)
          1. 首先安裝 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
          2. pytesser 依賴包 tesseract-ocrhttp://code.google.com/p/tesseract-ocr/  
                       tesseract-ocr 依賴庫| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解壓到 你安裝的 tesseract-ocr 的 識別學習庫下



          整理 www.aygfsteel.com/Good-Game
          posted on 2009-03-27 10:21 劉凱毅 閱讀(3235) 評論(3)  編輯  收藏 所屬分類: pythonimage

          Feedback

          # re: 驗證碼識別(2) 2009-03-27 15:31 .........
          這個不錯.不知道復雜的圖片識別怎么樣?  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-03-27 17:13 hwx
          還行哦,雖然識別碼簡單。我以前公司要用這些都是找人買的  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-07-11 09:41 wangdong
          呵呵,復雜的圖片可以進行前端處理,比如二值化,中值濾波等等,處理成黑白的圖片后再交給tesseract識別,不過對于背景色和字符色差不多的那種處理要麻煩一些  回復  更多評論
            

          主站蜘蛛池模板: 金坛市| 光泽县| 西城区| 应城市| 环江| 桦甸市| 辽宁省| 嵊州市| 兴城市| 香港| 秭归县| 余干县| 恩施市| 右玉县| 博乐市| 镇江市| 湖州市| 马关县| 临清市| 娱乐| 民权县| 玉门市| 横峰县| 璧山县| 泊头市| 浙江省| 陆河县| 兴义市| 鹿泉市| 方正县| 临清市| 安丘市| 安达市| 东台市| 闽侯县| 吉首市| 章丘市| 公安县| 黑龙江省| 兴隆县| 从江县|