關于用lucene做網站后臺搜索的一點點設想

          最近一直在搞lucene和quartz的自動調度。
          自己的想法是,
          lucene構建index的數據來自數據庫中,建立2個索引,一個是正式的索引,還有一個是臨時索引,臨時索引在每天的凌晨進行索引還有一個合并臨時索引和正式索引的類,也在其建立完成之后進行運行。
          或者可以在數據量在原有基礎上增加了多少的時候進行,臨時索引和合并索引,只不過這種方式,首要條件是你的服務器必須強大,因為在建立臨時索引和合并索引的時候會很卡。
          還有一種方法是比較浙中一點的,首先考慮數據量增加了多少,當達到這個值的時候再在第二天的凌晨進行臨時索引和合并索引的工作。
          相比之下,第一個在每天數據量增加值不是很大變化的情況下,而第二種方法則偏重于數據量增加不能確定的情況下,也就是浮動很大。
          第三種方案,數據增加量也是一個浮動的情況下,第三種方案相比第二種方案,用戶在建立臨時索引和合并索引的時候可能感覺不到。但是都有一個缺陷,也就是如果在這個增加量的范圍內進入的數據不能得到索引,所以最終方案還是采用第一種方法比較合適。

          posted on 2009-03-15 13:34 duduli 閱讀(339) 評論(0)  編輯  收藏 所屬分類: java

          <2009年3月>
          22232425262728
          1234567
          891011121314
          15161718192021
          22232425262728
          2930311234

          導航

          統計

          公告

          welcome to my place.

          常用鏈接

          留言簿(5)

          我參與的團隊

          隨筆分類

          隨筆檔案

          新聞分類

          石頭JAVA擺地攤兒

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          @duduli
          主站蜘蛛池模板: 重庆市| 林口县| 莱芜市| 奈曼旗| 怀柔区| 泸溪县| 灯塔市| 宜黄县| 玛曲县| 蒙城县| 馆陶县| 舞钢市| 安多县| 河间市| 庐江县| 琼中| 怀柔区| 修水县| 奉新县| 韶山市| 荣昌县| 习水县| 石阡县| 上饶市| 宝应县| 湖州市| 尚义县| 柳州市| 邵武市| 沾化县| 镇江市| 普格县| 海林市| 鹿邑县| 廊坊市| 安达市| 随州市| 安泽县| 杨浦区| 东丰县| 涟源市|