隨筆-193  評論-715  文章-1  trackbacks-0
            lucene是一個十分不錯的全文檢索系統,其實在很早以前我就從放飛技術網(www.frontfree.net)知道了這個系統,但沒有試用過,直到前幾天一個朋友要我幫他調試weblucene,我才決定試用一下lucene。
            之所以說lucene不錯,是因為它與數據庫檢索系統比起來有許多優點,具體的優點你可以參考車東的一篇文章:“在應用中加入全文檢索功能 ——基于Java的全文索引引擎Lucene簡介(www.chedong.com/tech/lucene.html)”。
            測試系統配置:WinXP Professional SP1+Java JDK1.4.2+Resin3.0.9
            一、建立應用環境
            1、將文件luceneweb.war復制到你的Resin3.0.9\webapps目錄下,并啟動Resin,運行IE(localhost:8080),系統會自動為你生成一個名為luceneweb的目錄。
            2、將lucene-1.3-final.jar、lucene-demos-1.3-final.jar加入到系統配置的classpath中。
            3、建立索引文件:
             首先建立一個目錄dest,此目錄為你要檢索的對象,可以包含子目錄,并將你要索引的文件放入此目錄中(注意,只能索引 .html,.htm,.txt 三種文件格式,其它格式需要你自己修改)。
             然后建立一個目錄luceneindex,此目錄存放建立好的索引文件。
             運行CMD,進入你的luceneindex目錄,運行如下命令:
              C:\resin-3.0.9\webapps\luceneweb\luceneindex>java org.apache.lucene.demo.IndexHTML -create -index C:\resin-2.1.6\webapps\luceneindex ../dest
             此時你的luceneindex目錄下會產生三個文件,建立索引文件完成。
            4、修改configuration.jsp文件:
             將 String indexLocation = "/opt/lucene/index"; 修改為你的索引文件所在的目錄。如:
               String indexLocation = "C:\\resin-3.0.9\\webapps\\luceneweb\\luceneindex";
            5、一切均已完成,Enjoy it!
            測試結果貼圖:
          注:1、我在Tomcat 4.0上也測試了一下,但是對中文的支持真的太差了,而Resin對中文的支持確實還不錯。
            2、lucene不具有實時性,這也是它的一個缺陷,需要手工建立索引和更新,當然我們可以使用線程在WEB應用中每隔一段時間就自動建立和更新一次索引,這樣便可得到改善。
          posted on 2005-11-28 10:22 Robin's Programming World 閱讀(645) 評論(0)  編輯  收藏 所屬分類: Java
          主站蜘蛛池模板: 巴南区| 惠州市| 新民市| 合水县| 皮山县| 武隆县| 乌拉特中旗| 历史| 中牟县| 泸西县| 岢岚县| 金乡县| 宝兴县| 高淳县| 苍溪县| 德州市| 庆阳市| 临潭县| 白山市| 闵行区| 和龙市| 房产| 昆明市| 监利县| 鱼台县| 辽中县| 旬邑县| 诏安县| 泰兴市| 温泉县| 津市市| 徐水县| 苍梧县| 吕梁市| 临清市| 蒲城县| 南和县| 广德县| 岳池县| 海门市| 登封市|