新的project需要做全文檢索,老板提示用Lucene,down來先研究了一番,發(fā)現(xiàn)不支持中文,于是搜到webLucene,一個在lucene基礎(chǔ)上擴(kuò)展的開源項目。
花了一個下午,把webLucene環(huán)境搭好了,看看我需要的功能:中文分詞、數(shù)據(jù)庫為數(shù)據(jù)源、按類別搜索、以web展示結(jié)果 都有了,唯一需要解決的就是服務(wù)器cluster時index的更新問題了。這個目前的想法比較簡單,每個instance用自己的index file,在數(shù)據(jù)庫里做標(biāo)志位,每個instance都定期來查一遍,如果需要更新則更新自己的index。對我們這個實時性要求并不是那么高的search來說,已經(jīng)夠了
ps 不知道是不是chedong同志一個人更新精力不夠的原因,webLucene文檔——指install——似乎跟實際的東西還有些差別,不過,基本上自己也能找到原因小改一點就好了,開源的東東總不能要求像商務(wù)軟件那樣事無巨細(xì)的手把手教你。。。還有,如果用最新版的lucene(1.4)會有問題,有一個方法跟老版本的lucene不太一樣,必須使用webLucene包里lib下面那個lucene.jar。回頭等俺改的時候瞅瞅這個~~~
昨天還滿頭的霧水的俺開始有點頭緒了,雖然對lucene的機(jī)制還不是很清楚,但是就weblucene這個架子已經(jīng)夠俺用了,先在他基礎(chǔ)上修改再來定制俺的東西看起來還是比較容易di,hoho,還是站在前人的肩膀上做事比較輕松~~~前途還是光明di,俺做個幾天前對搜索還是一無所知的yin要做完這個全文檢索還是有可能di~~ ha ha ha,大笑三聲