隨筆-28  評論-51  文章-10  trackbacks-0

           

          文本檢索技術摘要

          信息檢索模型

          內容模型

          Boolean

          集合論(Fuzzy, extends boolean

           

          Vector

          代數論(VSM, GVSM,LSI, Neural networks

           

          Probabilistic

          概率論(推理網絡,置信網,語言模型,查詢擴展)

           

          結構模型

           

           

           

          瀏覽模型

           

           

           

          檢索質量評價

          查全率

           

           

           

           

          查準率

           

           

           

           

          F-measure

           

           

           

           

          其他評價(前10結果等)

           

           

           

          全文檢索的索引技術

          倒排(哈希,B-tree…

           

           

           

           

          倒排索引創建(兩趟算法)

           

           

           

          潛在語義索引(LSI

           

           

          原理

           

           

           

          SVD

           

           

           

          適用環境(靜態,動態)

           

           

           

          SVD分解降維

           

           

           

          SVD變換空間(相似度等)

           

           

           

          實例

           

           

           

           http://www.aygfsteel.com/Files/fullfocus/TextMining03.pdf

          該文對LSI的分析十分到位,還有詳細的實例。

          對索引的創建,很多思想可以借鑒:1. 大數據時,分批排序,再多路合并 2. 分塊寫入內存。 3.編碼壓縮(HUFFMAN等)

          posted on 2008-06-12 23:12 fullfocus 閱讀(2581) 評論(4)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 01:54 | 深圳聽濤酒店
          effect  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 09:40 | 代理163
          不錯,謝謝了~~~  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 12:57 | ~上善若水~
          傳智播客 & ajax全套獨家發布

          1.ajax 入門

          2.ajax 原理

          3.ajax 簡單實例

          4.ajax 無限級聯動菜單

          5.ajax 簡易聊天室

          6.ajax 開源框架簡介

          7.DWR 框架源碼分析一

          8.DWR 框架源碼分析二

          9.DWR 框架源碼分析三

          10.DWR 框架源碼分析四

          11.DWR框架源碼分析五

          12.SSH + DWR完成商城驅動

          13. Extjs 簡介

          14 Extjs  簡單實例

          15.SSH + Extjs 開發系列之OA一

          16. SSH + Extjs 開發系列之OA二

          17. SSH + Extjs 開發系列之OA三

          18. SSH + Extjs 開發系列之OA四

          19 .SSH + Extjs 開發系列之OA五

          20. SSH + Extjs 開發系列之OA六

          21. SSH + Extjs 開發系列之OA七

          22. SSH + Extjs 開發系列之OA八

          23.SSH + Extjs 開發系列之OA九

          24.SSH + Extjs 開發系列之OA十

          25. ajax 前景之我見

          下載地址:http://www.ibeifeng.com/read.php?tid=2338&u=5043  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2009-02-24 03:12 | mercy
          ??????
            回復  更多評論
            
          主站蜘蛛池模板: 兴宁市| 会宁县| 晋宁县| 当阳市| 青川县| 抚远县| 定兴县| 霍邱县| 合阳县| 外汇| 丰城市| 烟台市| 胶州市| 名山县| 广州市| 肥东县| 五河县| 隆化县| 当雄县| 通山县| 昌图县| 奎屯市| 永定县| 宝坻区| 永修县| 九龙城区| 梁山县| 高尔夫| 龙海市| 弥渡县| 深水埗区| 邵东县| 邵阳市| 阿瓦提县| 淮阳县| 雅江县| 疏附县| 石屏县| 禄丰县| 团风县| 西城区|