隨筆-28  評(píng)論-51  文章-10  trackbacks-0

           

          各種檢索系統(tǒng)介紹

          Smart

          免費(fèi),開(kāi)源(基于向量空間模型的文本信息檢索系統(tǒng),文檔支持不佳,500m以下)

           

           

          Okapi系統(tǒng)

          不免費(fèi),不提供源碼,

           

          基于概率檢索模型

           

           

          Lemur Toolkit系統(tǒng)

           

          Free,開(kāi)源,c/c++,

          完整的檢索系統(tǒng),也是toolkit,加入語(yǔ)言模型,文檔,代碼支持良好

           

           

          Lucene/nutch

          索引/這里解釋很詳細(xì)

          編碼和索引結(jié)構(gòu)

          Delta編碼

          Vint

           

           

          技術(shù)熱點(diǎn)

          自然語(yǔ)言

           

          概念/LSI

           

          用戶模型

           

           

          [各種技術(shù)的混合]

           

          索引

          各種建立索引的數(shù)據(jù)結(jié)構(gòu)HASH,B+樹(shù),R樹(shù)。。。。。

           

           

          這一部分,重點(diǎn)介紹了現(xiàn)成的幾個(gè)應(yīng)用系統(tǒng),特別是luence,還有建立索引的各種數(shù)據(jù)結(jié)構(gòu)。其中,關(guān)于熱點(diǎn)部分,可以重點(diǎn)關(guān)注下,對(duì)自己的研究方向有些指導(dǎo)作用。
          /Files/fullfocus/03.pdf

          posted on 2008-06-16 23:47 fullfocus 閱讀(1476) 評(píng)論(1)  編輯  收藏 所屬分類: 聚類算法研究

          評(píng)論:
          # re: 北大ppt 文本挖掘技術(shù)系列之三---TextMining03-檢索part2 2008-06-17 08:50 | mac521
          lz,這篇的ppt怎么沒(méi)有?  回復(fù)  更多評(píng)論
            
          主站蜘蛛池模板: 乐平市| 闸北区| 临邑县| 应城市| 闽清县| 赫章县| 城市| 威远县| 新竹县| 迁安市| 陈巴尔虎旗| 星子县| 延庆县| 岳阳市| 浦江县| 遂昌县| 墨竹工卡县| 青铜峡市| 秦安县| 五河县| 延边| 无锡市| 普格县| 综艺| 大悟县| 册亨县| 通海县| 渭源县| 丰宁| 大厂| 贺兰县| 沙田区| 宝坻区| 天镇县| 增城市| 六安市| 昌邑市| 巴林左旗| 徐汇区| 玛多县| 洞口县|