隨筆-28  評論-51  文章-10  trackbacks-0

           

          文本檢索技術摘要

          信息檢索模型

          內容模型

          Boolean

          集合論(Fuzzy, extends boolean

           

          Vector

          代數論(VSM, GVSM,LSI, Neural networks

           

          Probabilistic

          概率論(推理網絡,置信網,語言模型,查詢擴展)

           

          結構模型

           

           

           

          瀏覽模型

           

           

           

          檢索質量評價

          查全率

           

           

           

           

          查準率

           

           

           

           

          F-measure

           

           

           

           

          其他評價(前10結果等)

           

           

           

          全文檢索的索引技術

          倒排(哈希,B-tree…

           

           

           

           

          倒排索引創建(兩趟算法)

           

           

           

          潛在語義索引(LSI

           

           

          原理

           

           

           

          SVD

           

           

           

          適用環境(靜態,動態)

           

           

           

          SVD分解降維

           

           

           

          SVD變換空間(相似度等)

           

           

           

          實例

           

           

           

           http://www.aygfsteel.com/Files/fullfocus/TextMining03.pdf

          該文對LSI的分析十分到位,還有詳細的實例。

          對索引的創建,很多思想可以借鑒:1. 大數據時,分批排序,再多路合并 2. 分塊寫入內存。 3.編碼壓縮(HUFFMAN等)

          posted on 2008-06-12 23:12 fullfocus 閱讀(2598) 評論(4)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 01:54 | 深圳聽濤酒店
          effect  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 09:40 | 代理163
          不錯,謝謝了~~~  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 12:57 | ~上善若水~
          傳智播客 & ajax全套獨家發布

          1.ajax 入門

          2.ajax 原理

          3.ajax 簡單實例

          4.ajax 無限級聯動菜單

          5.ajax 簡易聊天室

          6.ajax 開源框架簡介

          7.DWR 框架源碼分析一

          8.DWR 框架源碼分析二

          9.DWR 框架源碼分析三

          10.DWR 框架源碼分析四

          11.DWR框架源碼分析五

          12.SSH + DWR完成商城驅動

          13. Extjs 簡介

          14 Extjs  簡單實例

          15.SSH + Extjs 開發系列之OA一

          16. SSH + Extjs 開發系列之OA二

          17. SSH + Extjs 開發系列之OA三

          18. SSH + Extjs 開發系列之OA四

          19 .SSH + Extjs 開發系列之OA五

          20. SSH + Extjs 開發系列之OA六

          21. SSH + Extjs 開發系列之OA七

          22. SSH + Extjs 開發系列之OA八

          23.SSH + Extjs 開發系列之OA九

          24.SSH + Extjs 開發系列之OA十

          25. ajax 前景之我見

          下載地址:http://www.ibeifeng.com/read.php?tid=2338&u=5043  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2009-02-24 03:12 | mercy
          ??????
            回復  更多評論
            
          主站蜘蛛池模板: 虞城县| 天峻县| 巴楚县| 西乌珠穆沁旗| 敦煌市| 灵川县| 山阳县| 三明市| 临湘市| 丰都县| 栾城县| 潍坊市| 汾阳市| 贵溪市| 普陀区| 玉田县| 扎赉特旗| 广德县| 东光县| 武威市| 贞丰县| 蒙阴县| 亳州市| 阿克| 长沙县| 舒兰市| 大方县| 吴江市| 蕲春县| 方山县| 彭泽县| 昌吉市| 晋中市| 樟树市| 贵州省| 乌恰县| 玉门市| 天津市| 集安市| 宣武区| 和硕县|