新的project需要做全文檢索,老板提示用Lucene,down來(lái)先研究了一番,發(fā)現(xiàn)不支持中文,于是搜到webLucene,一個(gè)在lucene基礎(chǔ)上擴(kuò)展的開(kāi)源項(xiàng)目。
花了一個(gè)下午,把webLucene環(huán)境搭好了,看看我需要的功能:中文分詞、數(shù)據(jù)庫(kù)為數(shù)據(jù)源、按類(lèi)別搜索、以web展示結(jié)果 都有了,唯一需要解決的就是服務(wù)器cluster時(shí)index的更新問(wèn)題了。這個(gè)目前的想法比較簡(jiǎn)單,每個(gè)instance用自己的index file,在數(shù)據(jù)庫(kù)里做標(biāo)志位,每個(gè)instance都定期來(lái)查一遍,如果需要更新則更新自己的index。對(duì)我們這個(gè)實(shí)時(shí)性要求并不是那么高的search來(lái)說(shuō),已經(jīng)夠了
ps 不知道是不是chedong同志一個(gè)人更新精力不夠的原因,webLucene文檔——指install——似乎跟實(shí)際的東西還有些差別,不過(guò),基本上自己也能找到原因小改一點(diǎn)就好了,開(kāi)源的東東總不能要求像商務(wù)軟件那樣事無(wú)巨細(xì)的手把手教你。。。還有,如果用最新版的lucene(1.4)會(huì)有問(wèn)題,有一個(gè)方法跟老版本的lucene不太一樣,必須使用webLucene包里lib下面那個(gè)lucene.jar。回頭等俺改的時(shí)候瞅瞅這個(gè)~~~
昨天還滿頭的霧水的俺開(kāi)始有點(diǎn)頭緒了,雖然對(duì)lucene的機(jī)制還不是很清楚,但是就weblucene這個(gè)架子已經(jīng)夠俺用了,先在他基礎(chǔ)上修改再來(lái)定制俺的東西看起來(lái)還是比較容易di,hoho,還是站在前人的肩膀上做事比較輕松~~~前途還是光明di,俺做個(gè)幾天前對(duì)搜索還是一無(wú)所知的yin要做完這個(gè)全文檢索還是有可能di~~ ha ha ha,大笑三聲