之所以說lucene不錯,是因為它與數(shù)據(jù)庫檢索系統(tǒng)比起來有許多優(yōu)點,具體的優(yōu)點你可以參考車東的一篇文章:“在應(yīng)用中加入全文檢索功能 ——基于Java的全文索引引擎Lucene簡介(www.chedong.com/tech/lucene.html)”。
測試系統(tǒng)配置:WinXP Professional SP1+Java JDK1.4.2+Resin3.0.9
一、建立應(yīng)用環(huán)境
1、將文件luceneweb.war復(fù)制到你的Resin3.0.9\webapps目錄下,并啟動Resin,運行IE(localhost:8080),系統(tǒng)會自動為你生成一個名為luceneweb的目錄。
2、將lucene-1.3-final.jar、lucene-demos-1.3-final.jar加入到系統(tǒng)配置的classpath中。
3、建立索引文件:
首先建立一個目錄dest,此目錄為你要檢索的對象,可以包含子目錄,并將你要索引的文件放入此目錄中(注意,只能索引 .html,.htm,.txt 三種文件格式,其它格式需要你自己修改)。
然后建立一個目錄luceneindex,此目錄存放建立好的索引文件。
運行CMD,進入你的luceneindex目錄,運行如下命令:
C:\resin-3.0.9\webapps\luceneweb\luceneindex>java org.apache.lucene.demo.IndexHTML -create -index C:\resin-2.1.6\webapps\luceneindex ../dest
此時你的luceneindex目錄下會產(chǎn)生三個文件,建立索引文件完成。
4、修改configuration.jsp文件:
將 String indexLocation = "/opt/lucene/index"; 修改為你的索引文件所在的目錄。如:
String indexLocation = "C:\\resin-3.0.9\\webapps\\luceneweb\\luceneindex";
5、一切均已完成,Enjoy it!
測試結(jié)果貼圖:
注:1、我在Tomcat 4.0上也測試了一下,但是對中文的支持真的太差了,而Resin對中文的支持確實還不錯。
2、lucene不具有實時性,這也是它的一個缺陷,需要手工建立索引和更新,當然我們可以使用線程在WEB應(yīng)用中每隔一段時間就自動建立和更新一次索引,這樣便可得到改善。