Nutch 是基于 Lucene的。Lucene為 Nutch 提供了文本索引和搜索的API。一個常見的問題是;我應該使用Lucene還是Nutch?最簡單的回答是:如果你不需要抓取數據的話,應該使用Lucene。常見的應用場合是:你有數據源,需要為這些數據提供一個搜索頁面。在這種情況下,最好的方式是直接從數據庫中取出數據并用Lucene API建立索引。Nutch 適用于你無法直接獲取數據庫中的網站,或者比較分散的數據源的情況下使用。
posted on 2009-09-18 22:48
壞男孩 閱讀(1247)
評論(1) 編輯 收藏 所屬分類:
搜索引擎