關于用lucene做網站后臺搜索的一點點設想

          最近一直在搞lucene和quartz的自動調度。
          自己的想法是,
          lucene構建index的數據來自數據庫中,建立2個索引,一個是正式的索引,還有一個是臨時索引,臨時索引在每天的凌晨進行索引還有一個合并臨時索引和正式索引的類,也在其建立完成之后進行運行。
          或者可以在數據量在原有基礎上增加了多少的時候進行,臨時索引和合并索引,只不過這種方式,首要條件是你的服務器必須強大,因為在建立臨時索引和合并索引的時候會很卡。
          還有一種方法是比較浙中一點的,首先考慮數據量增加了多少,當達到這個值的時候再在第二天的凌晨進行臨時索引和合并索引的工作。
          相比之下,第一個在每天數據量增加值不是很大變化的情況下,而第二種方法則偏重于數據量增加不能確定的情況下,也就是浮動很大。
          第三種方案,數據增加量也是一個浮動的情況下,第三種方案相比第二種方案,用戶在建立臨時索引和合并索引的時候可能感覺不到。但是都有一個缺陷,也就是如果在這個增加量的范圍內進入的數據不能得到索引,所以最終方案還是采用第一種方法比較合適。

          posted on 2009-03-15 13:34 duduli 閱讀(332) 評論(0)  編輯  收藏 所屬分類: java

          <2009年3月>
          22232425262728
          1234567
          891011121314
          15161718192021
          22232425262728
          2930311234

          導航

          統計

          公告

          welcome to my place.

          常用鏈接

          留言簿(5)

          我參與的團隊

          隨筆分類

          隨筆檔案

          新聞分類

          石頭JAVA擺地攤兒

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          @duduli
          主站蜘蛛池模板: 内丘县| 四会市| 金塔县| 临沧市| 长泰县| 济阳县| 遂平县| 兰州市| 乌鲁木齐市| 繁昌县| 平塘县| 柳江县| 桑日县| 上饶县| 芒康县| 洛南县| 凯里市| 开阳县| 惠水县| 吐鲁番市| 信丰县| 白银市| 应用必备| 淄博市| 获嘉县| 沾化县| 桐柏县| 雷波县| 开阳县| 信阳市| 安远县| 台州市| 滕州市| 虎林市| 阿拉善右旗| 山西省| 万源市| 安化县| 潞城市| 九寨沟县| 普陀区|