無為

無為則可為，無為則至深！

:: 管理

190 Posts :: 291 Stories :: 258 Comments :: 0 Trackbacks

　文本挖掘(Text Mining)是一個從非結構化文本信息中獲取用戶感興趣或者有用的模式的過程，文本挖掘涵蓋多種技術,包括信息抽取,信息檢索,自然語言處理和數據挖掘技術。它的主要用途是從原本未經使用的文本中提取出未知的知識，但是文本挖掘也是一項非常困難的工作,因為它必須處理那些本來就模糊而且非結構化的文本數據,所以它是一個多學科混雜的領域,涵蓋了信息技術、文本分析、模式識別、統計學、數據可視化、數據庫技術、機器學習以及數據挖掘等技術

文本挖掘是應用驅動的。它在商業智能、信息檢索、生物信息處理等方面都有廣泛的應用；例如，客戶關系管理，自動郵件回復，垃圾郵件過濾，自動簡歷評審，搜索引擎等等。

文本挖掘可以通過下圖有個大致理解。它由三部分組成：底層是文本挖掘的基礎領域，包括機器學習、數理統計、自然語言處理；在此基礎上是文本挖掘的基本技術，有五大類，包括文本信息抽取、文本分類、文本聚類、文本數據壓縮、文本數據處理；在基本技術之上是兩個主要應用領域，包括信息訪問和知識發現，信息訪問包括信息檢索、信息瀏覽、信息過濾、信息報告，知識發現包括數據分析、數據預測。

? ?

凡是有該標志的文章，都是該blog博主Caoer（草兒）原創，凡是索引、收藏
、轉載請注明來處和原文作者。非常感謝。

posted on 2006-09-07 12:54 草兒閱讀(304) 評論(0) 編輯收藏所屬分類: BI and DM

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: Capacity Planning for the Data Warehouse Environment Bill Gates Is A Failure cognos開發心得 WEB數據倉庫系統層次結構輕量級數據倉庫移動電信數據倉庫設計六環節數據挖掘--極具發展前景的新領域智能學習資源最佳JAVA BI工具專家觀點：數據挖掘的本質

無為

公告

隨筆分類(222)

隨筆檔案(188)

相冊

收藏夾(6)

AJAX

DB BI DM

ＪＡＶＡ編程論壇

ＵＭＬ技術論壇

搜索

積分與排名

最新評論

閱讀排行榜