隨筆-28  評論-51  文章-10  trackbacks-0

           

          各種檢索系統(tǒng)介紹

          Smart

          免費(fèi),開源(基于向量空間模型的文本信息檢索系統(tǒng),文檔支持不佳,500m以下)

           

           

          Okapi系統(tǒng)

          不免費(fèi),不提供源碼,

           

          基于概率檢索模型

           

           

          Lemur Toolkit系統(tǒng)

           

          Free,開源,c/c++,

          完整的檢索系統(tǒng),也是toolkit,加入語言模型,文檔,代碼支持良好

           

           

          Lucene/nutch

          索引/這里解釋很詳細(xì)

          編碼和索引結(jié)構(gòu)

          Delta編碼

          Vint

           

           

          技術(shù)熱點(diǎn)

          自然語言

           

          概念/LSI

           

          用戶模型

           

           

          [各種技術(shù)的混合]

           

          索引

          各種建立索引的數(shù)據(jù)結(jié)構(gòu)HASHB+樹,R樹。。。。。

           

           

          這一部分,重點(diǎn)介紹了現(xiàn)成的幾個(gè)應(yīng)用系統(tǒng),特別是luence,還有建立索引的各種數(shù)據(jù)結(jié)構(gòu)。其中,關(guān)于熱點(diǎn)部分,可以重點(diǎn)關(guān)注下,對自己的研究方向有些指導(dǎo)作用。
          /Files/fullfocus/03.pdf

          posted on 2008-06-16 23:47 fullfocus 閱讀(1481) 評論(1)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術(shù)系列之三---TextMining03-檢索part2 2008-06-17 08:50 | mac521
          lz,這篇的ppt怎么沒有?  回復(fù)  更多評論
            
          主站蜘蛛池模板: 福州市| 开远市| 凉山| 霍邱县| 闻喜县| 张家界市| 钦州市| 柳林县| 桃江县| 南丹县| 永平县| 镇原县| 白玉县| 西安市| 日喀则市| 庄浪县| 嵩明县| 筠连县| 新余市| 太仓市| 淳化县| 白朗县| 济源市| 澎湖县| 汝城县| 集贤县| 大关县| 平山县| 宜黄县| 阜城县| 泉州市| 嘉黎县| 鄂温| 萝北县| 罗山县| 当阳市| 岗巴县| 克拉玛依市| 新和县| 乌恰县| 宜良县|