無為

          無為則可為,無為則至深!

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            190 Posts :: 291 Stories :: 258 Comments :: 0 Trackbacks

           文本挖掘(Text Mining)是一個從非結構化文本信息中獲取用戶感興趣或者有用的模式的過程,文本挖掘涵蓋多種技術,包括信息抽取,信息檢索,自然語言處理和數據挖掘技術。 它的主要用途是從原本未經使用的文本中提取出未知的知識,但是文本挖掘也是一項非常困難的工作,因為它必須處理那些本來就模糊而且非結構化的文本數據,所以它是一個多學科混雜的領域,涵蓋了信息技術、文本分析、模式識別、統計學、數據可視化、數據庫技術、機器學習以及數據挖掘等技術

          文本挖掘是應用驅動的。它在商業智能、信息檢索、生物信息處理等方面都有廣泛的應用;例如,客戶關系管理,自動郵件回復,垃圾郵件過濾,自動簡歷評審,搜索引擎等等。

          文本挖掘可以通過下圖有個大致理解。它由三部分組成:底層是文本挖掘的基礎領域,包括機器學習、數理統計、自然語言處理;在此基礎上是文本挖掘的基本技術,有五大類,包括文本信息抽取、文本分類、文本聚類、文本數據壓縮、文本數據處理;在基本技術之上是兩個主要應用領域,包括信息訪問和知識發現,信息訪問包括信息檢索、信息瀏覽、信息過濾、信息報告,知識發現包括數據分析、數據預測。

          ? ?



          凡是有該標志的文章,都是該blog博主Caoer(草兒)原創,凡是索引、收藏
          、轉載請注明來處和原文作者。非常感謝。

          posted on 2006-09-07 12:54 草兒 閱讀(305) 評論(0)  編輯  收藏 所屬分類: BI and DM
          主站蜘蛛池模板: 金寨县| 泾川县| 鸡泽县| 凌云县| 临澧县| 林甸县| 疏勒县| 澄城县| 怀仁县| 商都县| 株洲市| 荥经县| 从江县| 扶绥县| 宜昌市| 涡阳县| 襄汾县| 繁昌县| 溧水县| 碌曲县| 遂平县| 巴林左旗| 德兴市| 黔南| 新乡市| 新源县| 湘潭市| 高雄市| 万源市| 彩票| 远安县| 夏河县| 元江| 普陀区| 文登市| 南澳县| 孟村| 曲麻莱县| 顺平县| 铁岭县| 嵊州市|