隨筆-28  評論-51  文章-10  trackbacks-0

           

          文本檢索技術摘要

          信息檢索模型

          內容模型

          Boolean

          集合論(Fuzzy, extends boolean

           

          Vector

          代數論(VSM, GVSM,LSI, Neural networks

           

          Probabilistic

          概率論(推理網絡,置信網,語言模型,查詢擴展)

           

          結構模型

           

           

           

          瀏覽模型

           

           

           

          檢索質量評價

          查全率

           

           

           

           

          查準率

           

           

           

           

          F-measure

           

           

           

           

          其他評價(前10結果等)

           

           

           

          全文檢索的索引技術

          倒排(哈希,B-tree…

           

           

           

           

          倒排索引創建(兩趟算法)

           

           

           

          潛在語義索引(LSI

           

           

          原理

           

           

           

          SVD

           

           

           

          適用環境(靜態,動態)

           

           

           

          SVD分解降維

           

           

           

          SVD變換空間(相似度等)

           

           

           

          實例

           

           

           

           http://www.aygfsteel.com/Files/fullfocus/TextMining03.pdf

          該文對LSI的分析十分到位,還有詳細的實例。

          對索引的創建,很多思想可以借鑒:1. 大數據時,分批排序,再多路合并 2. 分塊寫入內存。 3.編碼壓縮(HUFFMAN等)

          posted on 2008-06-12 23:12 fullfocus 閱讀(2581) 評論(4)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 01:54 | 深圳聽濤酒店
          effect  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 09:40 | 代理163
          不錯,謝謝了~~~  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 12:57 | ~上善若水~
          傳智播客 & ajax全套獨家發布

          1.ajax 入門

          2.ajax 原理

          3.ajax 簡單實例

          4.ajax 無限級聯動菜單

          5.ajax 簡易聊天室

          6.ajax 開源框架簡介

          7.DWR 框架源碼分析一

          8.DWR 框架源碼分析二

          9.DWR 框架源碼分析三

          10.DWR 框架源碼分析四

          11.DWR框架源碼分析五

          12.SSH + DWR完成商城驅動

          13. Extjs 簡介

          14 Extjs  簡單實例

          15.SSH + Extjs 開發系列之OA一

          16. SSH + Extjs 開發系列之OA二

          17. SSH + Extjs 開發系列之OA三

          18. SSH + Extjs 開發系列之OA四

          19 .SSH + Extjs 開發系列之OA五

          20. SSH + Extjs 開發系列之OA六

          21. SSH + Extjs 開發系列之OA七

          22. SSH + Extjs 開發系列之OA八

          23.SSH + Extjs 開發系列之OA九

          24.SSH + Extjs 開發系列之OA十

          25. ajax 前景之我見

          下載地址:http://www.ibeifeng.com/read.php?tid=2338&u=5043  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2009-02-24 03:12 | mercy
          ??????
            回復  更多評論
            
          主站蜘蛛池模板: 启东市| 台前县| 南丰县| 阿勒泰市| 家居| 缙云县| 嘉禾县| 花莲县| 鄂尔多斯市| 林甸县| 洞头县| 深泽县| 隆尧县| 黑水县| 武义县| 哈巴河县| 新兴县| 莱芜市| 克拉玛依市| 石泉县| 兰考县| 哈巴河县| 新丰县| 图木舒克市| 临沭县| 军事| 上蔡县| 洪湖市| 阳江市| 织金县| 祥云县| 玛纳斯县| 霍林郭勒市| 宝应县| 通山县| 乐清市| 凤台县| 军事| 遵义县| 遂昌县| 疏勒县|