模式識別是一種從大量信息和數據出發,在專家經驗和已有認識的基礎上,利用計算機和數學推理的方法對形狀、模式、曲線、數字、字符格式和圖形自動完成識別的過程。模式識別包括相互關聯的兩個階段,即學習階段和實現階段,前者是對樣本進行特征選擇,尋找分類的規律,后者是根據分類規律對未知樣本集進行分類和識別。廣義的模式識別屬計算機科學中智能模擬的研究范疇,內容非常廣泛,包括聲音和語言識別、文字識別、指紋識別、聲納信號和地震信號分析、照片圖片分析、化學模式識別等等。計算機模式識別實現了部分腦力勞動自動化。
模式識別--對表征事物或現象的各種形式的(數值的,文字的和邏輯關系的)信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。
模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬于概念識別研究的范疇,是人工智能的另一研究分支。我們所指的模式識別主要是對語音波形、地震波、心電圖、腦電圖、圖片、文字、符號、三位物體和景物以及各種可以用物理的、化學的、生物的傳感器對對象進行測量的具體模式進行分類和辨識。
模式識別問題指的是對一系列過程或事件的分類與描述,具有某些相類似的性質的過程或事件就分為一類。模式識別問題一般可以應用以下4種方法進行分析處理。
統計模式識別方法:統計模式識別方法是受數學中的決策理論的啟發而產生的一種識別方法,它一般假定被識別的對象或經過特征提取向量是符合一定分布規律的隨機變量。其基本思想是將特征提取階段得到的特征向量定義在一個特征空間中,這個空間包含了所有的特征向量,不同的特征向量,或者說不同類別的對象都對應于空間中的一點。在分類階段,則利用統計決策的原理對特征空間進行劃分,從而達到識別不同特征的對象的目的。統計模式識別中個應用的統計決策分類理論相對比較成熟,研究的重點是特征提取。
人工神經網絡模式識別:人工神經網絡的研究起源于對生物神經系統的研究。人工神經網絡區別于其他識別方法的最大特點是它對待識別的對象不要求有太多的分析與了解,具有一定的智能化處理的特點。
句法結構模式識別:句法結構模式識別著眼于對待識別對象的結構特征的描述。
在上述4種算法中,統計模式識別是最經典的分類識別方法,在圖像模式識別中有著非常廣泛的應用。
模式識別研究方向
模式識別研究主要集中在兩方面,即研究生物體(包括人)是如何感知對象的,屬于認知科學的范疇,以及在給定的任務下,如何用計算機實現模式識別的理論和方法。前者是生理學家、心理學家、生物學家和神經生理學家的研究內容,后者通過數學家、信息學專家和計算機科學工作著近幾十年來的努力,已經取得了系統的研究成果。
一個計算機模式識別系統基本上事有三部分組成的,即數據采集、數據處理和分類決策或模型匹配。任何一種模式識別方法都首先要通過各種傳感器把被研究對象的各種物理變量轉換為計算機可以接受的數值或符號(串)集合。習慣上,稱這種數值或符號(串)所組成的空間為模式空間。為了從這些數字或符號(串)中抽取出對識別有效的信息,必須對它進行處理,其中包括消除噪聲,排除不相干的信號以及與對象的性質和采用的識別方法密切相關的特征的計算(如表征物體的形狀、周長、面積等等)以及必要的變換(如為得到信號功率譜所進行的快速傅里葉變換)等。然后通過特征選擇和提取或基元選擇形成模式的特征空間。以后的模式分類或模型匹配就在特征空間的基礎上進行。系統的輸出或者是對象所屬的類型或者是模型數據庫中與對象最相似的模型編號。針對不同應用目的,這三部分的內容可以有很大的差別,特別是在數據處理和識別這兩部分,為了提高識別結果的可靠性往往需要加入知識庫(規則)以對可能產生的錯誤進行修正,或通過引入限制條件大大縮小待識別模式在模型庫中的搜索空間,以減少匹配計算量。在某些具體應用中,如機器視覺,除了要給出被識別對象是什么物體外,還要求出該物體所處的位置和姿態以引導機器人的工作。
模式識別在實際中的應用
模式識別已經在天氣預報、衛星航空圖片解釋、工業產品檢測、字符識別、語音識別、指紋識別、醫學圖像分析等許多方面得到了成功的應用。所有這些應用都是和問題的性質密切不可分的,至今還沒有發展成統一的、有效的可應用于所有的模式識別的理論。當前的一種普遍看法是不存在對所有的模式識別問題都使用的單一模型和解決識別問題的單一技術,我們現在擁有的是一個工具袋,我們所要做的是結合具體問題把統計的和句法(結構)的識別方法結合起來,把統計模式識別或句法模式識別與人工智能中的啟發式搜索結合起來,把人工神經元網絡與各種以有技術以及人工智能中的專家系統,不確定方法結合起來,深入掌握各種工具的效能和應用的可能性,互相取長補短,開創模式識別應用的新局面。