David.Ko

          Follow my heart!
          posts - 100, comments - 11, trackbacks - 0, articles - 0
             :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          模式識別的原理是什么

          Posted on 2007-07-11 10:52 David.Ko 閱讀(1510) 評論(0)  編輯  收藏 所屬分類: AI

          模式識別,就是通過計算機用數學技術方法來研究模式的自動處理和判讀。我們把環境與客體統稱為“模式”。隨著計算機技術的發展,人類有可能研究復雜的信息處理過程。信息處理過程的一個重要形式是生命體對環境及客體的識別。對人類來說,特別重要的是對光學信息(通過視覺器官來獲得)和聲學信息(通過聽覺器官來獲得)的識別。這是模式識別的兩個重要方面。市場上可見到的代表性產品有OCR(Optical Character Recognition),語音識別系統。

          計算機識別的顯著特點是速度快,準確性高,效率高。完全可以取代人工錄入。

          識別過程與人類的學習過程相似。以“漢字識別”為例:首先將漢字圖象進行處理,抽取主要表達特征并將特征與漢字的代碼存在計算機中。就象老師教我們這個字叫什么如何寫記在大腦中。這一過程叫做“訓練”。識別過程就是將輸入的漢字圖象經處理后與計算機中的所有字進行比較,找出最相近的字就是識別結果。這一過程叫做“匹配”。

          OCR還有一個重要組成部分是對具體對象的“版面分析”或稱“分割”。屬于圖象處理范疇。比如在一篇文章中將每個獨立的漢字切分出來;名片識別中要將每個字段切出來。切分的難度不亞于識別。

          以下給出OCR的常用概念與技術指標:

          識別率:正確識別的字符占所有測試字符的比例。是大量字符測試后的統計結果。
          拒識率:無法識別(沒有給出識別結果)的字符占所有測試字符的比例。
          誤識率:將甲識別成乙等識別錯誤的字符占所有測試字符的比例。
          識別速度:基于某種速度計算機的識別一個字符的時間或一秒鐘能識別字符的個數。
          掃描分辨率:指掃描儀光學源的物理分辨率。分辨率越高獲得的圖象越清晰。

                 那么人的模式識別是什么呢?看來主要的還是要依靠原先的認知結構。在專家記憶中有5到10萬個組快,且都按照層次網絡結構進行連接,而且易于提取。那么在認識或者學習新東西的時候,很容易對“模式”進行識別了。

          主站蜘蛛池模板: 雷山县| 右玉县| 达州市| 勐海县| 明溪县| 双牌县| 衡南县| 德阳市| 大余县| 苏尼特左旗| 南丹县| 广宁县| 岳西县| 漳州市| 冀州市| 措美县| 大渡口区| 当阳市| 怀来县| 宜章县| 灵丘县| 宁乡县| 启东市| 碌曲县| 瑞安市| 边坝县| 阿拉善盟| 辰溪县| 车致| 穆棱市| 诏安县| 县级市| 抚松县| 河南省| 饶平县| 巴东县| 济阳县| 绥芬河市| 德惠市| 大兴区| 拉孜县|