隨筆-28  評(píng)論-51  文章-10  trackbacks-0

           

          各種檢索系統(tǒng)介紹

          Smart

          免費(fèi),開源(基于向量空間模型的文本信息檢索系統(tǒng),文檔支持不佳,500m以下)

           

           

          Okapi系統(tǒng)

          不免費(fèi),不提供源碼,

           

          基于概率檢索模型

           

           

          Lemur Toolkit系統(tǒng)

           

          Free,開源,c/c++,

          完整的檢索系統(tǒng),也是toolkit,加入語(yǔ)言模型,文檔,代碼支持良好

           

           

          Lucene/nutch

          索引/這里解釋很詳細(xì)

          編碼和索引結(jié)構(gòu)

          Delta編碼

          Vint

           

           

          技術(shù)熱點(diǎn)

          自然語(yǔ)言

           

          概念/LSI

           

          用戶模型

           

           

          [各種技術(shù)的混合]

           

          索引

          各種建立索引的數(shù)據(jù)結(jié)構(gòu)HASH,B+樹,R樹。。。。。

           

           

          這一部分,重點(diǎn)介紹了現(xiàn)成的幾個(gè)應(yīng)用系統(tǒng),特別是luence,還有建立索引的各種數(shù)據(jù)結(jié)構(gòu)。其中,關(guān)于熱點(diǎn)部分,可以重點(diǎn)關(guān)注下,對(duì)自己的研究方向有些指導(dǎo)作用。
          /Files/fullfocus/03.pdf

          posted on 2008-06-16 23:47 fullfocus 閱讀(1476) 評(píng)論(1)  編輯  收藏 所屬分類: 聚類算法研究

          評(píng)論:
          # re: 北大ppt 文本挖掘技術(shù)系列之三---TextMining03-檢索part2 2008-06-17 08:50 | mac521
          lz,這篇的ppt怎么沒有?  回復(fù)  更多評(píng)論
            
          主站蜘蛛池模板: 东乌| 泰安市| 县级市| 红河县| 黑龙江省| 江孜县| 临漳县| 阳曲县| 东辽县| 长海县| 长春市| 康保县| 犍为县| 吴堡县| 汶上县| 张家港市| 余姚市| 萨迦县| 古丈县| 四子王旗| 琼中| 安远县| 会宁县| 巨野县| 潞西市| 四子王旗| 平果县| 杂多县| 太和县| 怀集县| 苍溪县| 吴堡县| 宁陕县| 高陵县| 玛多县| 武功县| 比如县| 湘潭市| 含山县| 武山县| 宝兴县|