隨筆-28  評論-51  文章-10  trackbacks-0

           

          文本檢索技術摘要

          信息檢索模型

          內容模型

          Boolean

          集合論(Fuzzy, extends boolean

           

          Vector

          代數論(VSM, GVSM,LSI, Neural networks

           

          Probabilistic

          概率論(推理網絡,置信網,語言模型,查詢擴展)

           

          結構模型

           

           

           

          瀏覽模型

           

           

           

          檢索質量評價

          查全率

           

           

           

           

          查準率

           

           

           

           

          F-measure

           

           

           

           

          其他評價(前10結果等)

           

           

           

          全文檢索的索引技術

          倒排(哈希,B-tree…

           

           

           

           

          倒排索引創建(兩趟算法)

           

           

           

          潛在語義索引(LSI

           

           

          原理

           

           

           

          SVD

           

           

           

          適用環境(靜態,動態)

           

           

           

          SVD分解降維

           

           

           

          SVD變換空間(相似度等)

           

           

           

          實例

           

           

           

           http://www.aygfsteel.com/Files/fullfocus/TextMining03.pdf

          該文對LSI的分析十分到位,還有詳細的實例。

          對索引的創建,很多思想可以借鑒:1. 大數據時,分批排序,再多路合并 2. 分塊寫入內存。 3.編碼壓縮(HUFFMAN等)

          posted on 2008-06-12 23:12 fullfocus 閱讀(2592) 評論(4)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 01:54 | 深圳聽濤酒店
          effect  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 09:40 | 代理163
          不錯,謝謝了~~~  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2008-06-13 12:57 | ~上善若水~
          傳智播客 & ajax全套獨家發布

          1.ajax 入門

          2.ajax 原理

          3.ajax 簡單實例

          4.ajax 無限級聯動菜單

          5.ajax 簡易聊天室

          6.ajax 開源框架簡介

          7.DWR 框架源碼分析一

          8.DWR 框架源碼分析二

          9.DWR 框架源碼分析三

          10.DWR 框架源碼分析四

          11.DWR框架源碼分析五

          12.SSH + DWR完成商城驅動

          13. Extjs 簡介

          14 Extjs  簡單實例

          15.SSH + Extjs 開發系列之OA一

          16. SSH + Extjs 開發系列之OA二

          17. SSH + Extjs 開發系列之OA三

          18. SSH + Extjs 開發系列之OA四

          19 .SSH + Extjs 開發系列之OA五

          20. SSH + Extjs 開發系列之OA六

          21. SSH + Extjs 開發系列之OA七

          22. SSH + Extjs 開發系列之OA八

          23.SSH + Extjs 開發系列之OA九

          24.SSH + Extjs 開發系列之OA十

          25. ajax 前景之我見

          下載地址:http://www.ibeifeng.com/read.php?tid=2338&u=5043  回復  更多評論
            
          # re: 北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1 2009-02-24 03:12 | mercy
          ??????
            回復  更多評論
            
          <2009年2月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          1234567

          常用鏈接

          留言簿(2)

          隨筆分類

          隨筆檔案

          文章檔案

          他山之石

          搜索

          •  

          積分與排名

          • 積分 - 48967
          • 排名 - 1004

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 凤凰县| 九寨沟县| 吉安县| 夏邑县| 虞城县| 金坛市| 若羌县| 辽宁省| 尚志市| 靖宇县| 文成县| 南岸区| 若羌县| 香格里拉县| 甘南县| 馆陶县| 和田市| 凤翔县| 枝江市| 淮滨县| 呼和浩特市| 临猗县| 丰镇市| 昌都县| 湄潭县| 铜鼓县| 阿瓦提县| 唐河县| 宜兰市| 滁州市| 色达县| 岳阳县| 赞皇县| 蒙阴县| 滦南县| 凤城市| 沭阳县| 禹州市| 资阳市| 霸州市| 出国|