Skynet

          ---------- ---------- 我的新 blog : liukaiyi.cublog.cn ---------- ----------

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            112 Posts :: 1 Stories :: 49 Comments :: 0 Trackbacks
                各位“蜘蛛俠”們大家可能在抓取頁面中的驗證碼而耿耿于懷,關于這點我想我目前可能能幫助下大家,在python中找到最接近與“殺手級別”的工具(源于開源,報與開源,好東西不干獨享)。


          調下大家的積極性 ,上圖



          python 包>> pytesser| http://code.google.com/p/pytesser/(其實 py包 使用很簡單的,關鍵在安裝)
          1. 首先安裝 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
          2. pytesser 依賴包 tesseract-ocrhttp://code.google.com/p/tesseract-ocr/  
                       tesseract-ocr 依賴庫| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解壓到 你安裝的 tesseract-ocr 的 識別學習庫下



          整理 www.aygfsteel.com/Good-Game
          posted on 2009-03-27 10:21 劉凱毅 閱讀(3236) 評論(3)  編輯  收藏 所屬分類: pythonimage

          Feedback

          # re: 驗證碼識別(2) 2009-03-27 15:31 .........
          這個不錯.不知道復雜的圖片識別怎么樣?  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-03-27 17:13 hwx
          還行哦,雖然識別碼簡單。我以前公司要用這些都是找人買的  回復  更多評論
            

          # re: 驗證碼識別(2) 2009-07-11 09:41 wangdong
          呵呵,復雜的圖片可以進行前端處理,比如二值化,中值濾波等等,處理成黑白的圖片后再交給tesseract識別,不過對于背景色和字符色差不多的那種處理要麻煩一些  回復  更多評論
            

          主站蜘蛛池模板: 遂平县| 乌拉特中旗| 微博| 潞西市| 鸡西市| 莱阳市| 郑州市| 永州市| 滕州市| 阿巴嘎旗| 囊谦县| 宁陕县| 元谋县| 东明县| 通化县| 织金县| 汝阳县| 平凉市| 宜兴市| 沙坪坝区| 宝山区| 麦盖提县| 连城县| 濮阳县| 定日县| 军事| 商丘市| 吉首市| 乐山市| 德阳市| 清远市| 蓬溪县| 新安县| 阳谷县| 南城县| 沿河| 遵义县| 嘉定区| 姚安县| 依兰县| 瑞安市|