隨筆-28  評論-51  文章-10  trackbacks-0

           

          各種檢索系統(tǒng)介紹

          Smart

          免費,開源(基于向量空間模型的文本信息檢索系統(tǒng),文檔支持不佳,500m以下)

           

           

          Okapi系統(tǒng)

          不免費,不提供源碼,

           

          基于概率檢索模型

           

           

          Lemur Toolkit系統(tǒng)

           

          Free,開源,c/c++,

          完整的檢索系統(tǒng),也是toolkit,加入語言模型,文檔,代碼支持良好

           

           

          Lucene/nutch

          索引/這里解釋很詳細(xì)

          編碼和索引結(jié)構(gòu)

          Delta編碼

          Vint

           

           

          技術(shù)熱點

          自然語言

           

          概念/LSI

           

          用戶模型

           

           

          [各種技術(shù)的混合]

           

          索引

          各種建立索引的數(shù)據(jù)結(jié)構(gòu)HASHB+樹,R樹。。。。。

           

           

          這一部分,重點介紹了現(xiàn)成的幾個應(yīng)用系統(tǒng),特別是luence,還有建立索引的各種數(shù)據(jù)結(jié)構(gòu)。其中,關(guān)于熱點部分,可以重點關(guān)注下,對自己的研究方向有些指導(dǎo)作用。
          /Files/fullfocus/03.pdf

          posted on 2008-06-16 23:47 fullfocus 閱讀(1476) 評論(1)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術(shù)系列之三---TextMining03-檢索part2 2008-06-17 08:50 | mac521
          lz,這篇的ppt怎么沒有?  回復(fù)  更多評論
            
          主站蜘蛛池模板: 突泉县| 鲜城| 时尚| 金塔县| 耒阳市| 佛山市| 宜川县| 潼南县| 上林县| 黑龙江省| 繁昌县| 房山区| 宝鸡市| 云浮市| 成安县| 叙永县| 伊通| 竹溪县| 壶关县| 云阳县| 南汇区| 河南省| 阿合奇县| 东阿县| 吴川市| 阿瓦提县| 饶阳县| 德兴市| 喜德县| 绵阳市| 林芝县| 昂仁县| 左贡县| 贡嘎县| 沙坪坝区| 永兴县| 舒兰市| 晋中市| 积石山| 台江县| 浮梁县|