隨筆-28  評論-51  文章-10  trackbacks-0

           

          各種檢索系統介紹

          Smart

          免費,開源(基于向量空間模型的文本信息檢索系統,文檔支持不佳,500m以下)

           

           

          Okapi系統

          不免費,不提供源碼,

           

          基于概率檢索模型

           

           

          Lemur Toolkit系統

           

          Free,開源,c/c++,

          完整的檢索系統,也是toolkit,加入語言模型,文檔,代碼支持良好

           

           

          Lucene/nutch

          索引/這里解釋很詳細

          編碼和索引結構

          Delta編碼

          Vint

           

           

          技術熱點

          自然語言

           

          概念/LSI

           

          用戶模型

           

           

          [各種技術的混合]

           

          索引

          各種建立索引的數據結構HASHB+樹,R樹。。。。。

           

           

          這一部分,重點介紹了現成的幾個應用系統,特別是luence,還有建立索引的各種數據結構。其中,關于熱點部分,可以重點關注下,對自己的研究方向有些指導作用。
          /Files/fullfocus/03.pdf

          posted on 2008-06-16 23:47 fullfocus 閱讀(1481) 評論(1)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: 北大ppt 文本挖掘技術系列之三---TextMining03-檢索part2 2008-06-17 08:50 | mac521
          lz,這篇的ppt怎么沒有?  回復  更多評論
            
          主站蜘蛛池模板: 简阳市| 扎兰屯市| 大关县| 天等县| 搜索| 乡城县| 建昌县| 西宁市| 浦县| 左权县| 黄山市| 水富县| 佛学| 监利县| 汕头市| 屯昌县| 林周县| 仁寿县| 聊城市| 花垣县| 郎溪县| 宝应县| 游戏| 大埔县| 定远县| 秦皇岛市| 阿坝县| 洪湖市| 灵石县| 内黄县| 务川| 西城区| 宜兴市| 陵川县| 玉林市| 民勤县| 赞皇县| 廊坊市| 安远县| 长汀县| 潮安县|