新的project需要做全文檢索,老板提示用Lucene,down來先研究了一番,發現不支持中文,于是搜到webLucene,一個在lucene基礎上擴展的開源項目。
花了一個下午,把webLucene環境搭好了,看看我需要的功能:中文分詞、數據庫為數據源、按類別搜索、以web展示結果 都有了,唯一需要解決的就是服務器cluster時index的更新問題了。這個目前的想法比較簡單,每個instance用自己的index file,在數據庫里做標志位,每個instance都定期來查一遍,如果需要更新則更新自己的index。對我們這個實時性要求并不是那么高的search來說,已經夠了
ps 不知道是不是chedong同志一個人更新精力不夠的原因,webLucene文檔——指install——似乎跟實際的東西還有些差別,不過,基本上自己也能找到原因小改一點就好了,開源的東東總不能要求像商務軟件那樣事無巨細的手把手教你。。。還有,如果用最新版的lucene(1.4)會有問題,有一個方法跟老版本的lucene不太一樣,必須使用webLucene包里lib下面那個lucene.jar?;仡^等俺改的時候瞅瞅這個~~~
昨天還滿頭的霧水的俺開始有點頭緒了,雖然對lucene的機制還不是很清楚,但是就weblucene這個架子已經夠俺用了,先在他基礎上修改再來定制俺的東西看起來還是比較容易di,hoho,還是站在前人的肩膀上做事比較輕松~~~前途還是光明di,俺做個幾天前對搜索還是一無所知的yin要做完這個全文檢索還是有可能di~~ ha ha ha,大笑三聲