基于Java的開源
Carrot2 搜索結果聚合聚類引擎
2.0發布了. Carrot2 可以自動的把自然的搜索結果歸類(聚合聚類)到相應的語義類別中,這個功能是通過Carrot2一個現成的組件完成的,除此之外Carrot2 還包括了很多其他的搜索結果聚合聚類算法
search results clustering algorithms
?非常值得一看. 今天10b lobster?和我聊起了新聞標題的平移算法, 如果這個算法被 Carrot支持的話,應該是一個流行算法了。這個算法在盧亮的blog上曾經提到過。新聞閱讀器也準備用這個算法進行新聞分類,提高新聞閱讀速度。
Carrot2 2.0 的一個亮點是速度和易用性的提高。在易用性方面Carrot2提供了一個叫Aduna ClusterMap? 的可視化組,這個組件被放到了可以單獨運行的GUI程序中了,詳見:standalone GUI application?。除此之外核心api也得到了簡化,這里有更多信息.
?Carrot2 的流行還衍生了一家叫 Carrot Search?的公司,類似 jboss ,mysql 相關的運營公司, 他們發布了發布了 Lingo3G ,可以想想出來了, Lingo3G (?這個名字真酷 lingo? and 3g 呵呵?)-- 提供高性能的 文檔聚合引擎 ,這個引擎功能十分強進,他提供基于層級的,同義的 , 標簽過濾的等功能。相比較 autonomy 還是有些差:
?
Autonomy的技術內核,是一個被稱為IDOL的智能信息處理層。IDOL由動態推理引擎 (DRE)、分類服務器、用戶服務器等模塊組成,DRE 可實現概念識別、自動摘要、有效識別、自動超鏈接、自然語言檢索等核心操作,分類服務器可實現自動聚類、自動分類、自動目錄生成等功能操作,用戶服務器則可以實現個人化信息創建、個性化信息提示、個性化信息訓練、專家定位等個性化操作。
你是不是和我一樣急不可耐了?想看Demo ?Let's Go ?
?
相關閱讀:
?????????????????? 新聞閱讀器 ? Carrot2 live demo ? 這是他們的 項目地址 .