大漠駝鈴

          置身浩瀚的沙漠,方向最為重要,希望此blog能向大漠駝鈴一樣,給我方向和指引。
          Java,Php,Shell,Python,服務器運維,大數據,SEO, 網站開發、運維,云服務技術支持,IM服務供應商, FreeSwitch搭建,技術支持等. 技術討論QQ群:428622099
          隨筆 - 238, 文章 - 3, 評論 - 117, 引用 - 0
          數據加載中……

          搜索服務

          Lucene等
          Lucene 索引數據庫2
               摘要: Lucene,作為一種全文搜索的輔助工具,為我們進行條件搜索,無論是像Google,Baidu之類的搜索引擎,還是論壇中的搜索功能,還是其它 C/S架構的搜索,都帶來了極大的便利和比較高的效率。本文主要是利用Lucene對MS Sql Server 2000進行建立索引,然后進行全文索引。至于數據庫的內容,可以是網頁的內容,還是其它的。本文中數據庫的內容是圖書館管理系統中的某個作者表-Authors表。

            因為考慮到篇幅的問題,所以該文不會講的很詳細,也不可能講的很深。

            本文以這樣的結構進行:

            1.介紹數據庫中Authors表的結構

            2.為數據庫建立索引

            3.為數據庫建立查詢功能

            4.在web界面下進行查詢并顯示結果

            1.介紹數據庫中Authors表的結構

          字段名稱 字段類型 字段含義

          Au_id Varchar(11) 作者號 閱讀全文

          posted @ 2009-03-03 16:01 草原上的駱駝 閱讀(288) | 評論 (0)  編輯

          用Lucene索引數據庫
               摘要: (轉)http://www.wujianrong.com/archives/2007/03/lucene_7.html
          1.寫一段傳統的JDBC程序,講每條的用戶信息從數據庫讀取出來
          2.針對每條用戶記錄,建立一個lucene document
          Document doc = new Document();
          并根據你的需要,將用戶信息的各個字段對應luncene document中的field 進行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫
          3.編寫對索引庫的搜索程序(看lucene文檔),通過對lucene的索引庫的查找,你可以快速找到對應記錄的ID
          4.通過ID到數據庫中查找相關記錄   閱讀全文

          posted @ 2009-03-03 15:57 草原上的駱駝 閱讀(728) | 評論 (0)  編輯

          Lucene索引查詢分頁實例
               摘要: 一、輸入關鍵字的lucene.html



          請輸入關鍵字:



            閱讀全文

          posted @ 2009-03-03 15:56 草原上的駱駝 閱讀(1372) | 評論 (0)  編輯

          Lucene基本使用介紹
               摘要:

          本文的目的不在于對Lucene的概念和設計這些進行介紹,僅在于介紹怎么樣去使用Lucene來達到自己想要的幾種常見的全文檢索的需求,如果想深入了解 Lucene的話本文不會帶給你什么收獲的。看完本文后想更深入的了解Lucene請訪問:http://lucene.apache.org

          一. 概述

          隨著系統信息的越來越多,怎么樣從這些信息海洋中撈起自己想要的那一根針就變得非常重要了,全文檢索是通常用于解決此類問題的方案,而Lucene則為實現全文檢索的工具,任何應用都可通過嵌入它來實現全文檢索。

          二. 環境搭建

          從lucene.apache.org上下載最新版本的lucene.jar,將此jar作為項目的build path,那么在項目中就可以直接使用lucene了。

          三. 使用說明

          3.1. 基本概念

          這里介紹的主要為在使用中經常碰到一些概念,以大家都比較熟悉的數據庫來進行類比的講解,使用Lucene進行全文檢索的過程有點類似數據庫  閱讀全文

          posted @ 2009-03-03 11:35 草原上的駱駝 閱讀(282) | 評論 (0)  編輯

          為lucene加入簡單中文分詞
               摘要: 看到很多人做lucene的應用時候都要面臨中文分詞怎么加的問題,下面介紹一個簡單的中文詞庫,這個詞庫附帶相應的算法,數據結構學過的人看懂沒什么問題,只要簡單的構造一個對象,就可以分詞了,對于不是太大的應用來說,還是相當可行的,點擊下載  閱讀全文

          posted @ 2009-03-03 11:34 草原上的駱駝 閱讀(276) | 評論 (0)  編輯

          用Lucene檢索數據庫
               摘要: 1.寫一段傳統的JDBC程序,講每條的用戶信息從數據庫讀取出來
          2.針對每條用戶記錄,建立一個lucene document
          Document doc = new Document();
          并根據你的需要,將用戶信息的各個字段對應luncene document中的field 進行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫
          3.編寫對索引庫的搜索程序(看lucene文檔),通過對lucene的索引庫的查找,你可以快速找到對應記錄的ID
          4.通過ID到數據庫中查找相關記錄   閱讀全文

          posted @ 2009-03-03 11:33 草原上的駱駝 閱讀(2867) | 評論 (1)  編輯

          Lucene全文檢索實踐
               摘要: Lucene 是 Apache 的一個子項目,是一個全文檢索的搜索引擎庫。其提供了簡單實用的 API,通過這些 API,可以自行編寫對文件(TEXT/XML/HTML等)、目錄、數據庫的全文檢索程序。

          Features:
          * Very fast indexing, minimal RAM required
          * Index compression to 30% of original text
          * Indexes text and HTML, document classes available for XML, PDF and RTF
          * Search supports phrase and Boolean queries, plus, minus and quote marks, and parentheses
          * Allows single and multiple character wildcards anywhere in the search words, fuzzy search, proximity
          *  閱讀全文

          posted @ 2009-03-03 11:31 草原上的駱駝 閱讀(1960) | 評論 (10)  編輯

          主站蜘蛛池模板: 泰和县| 芦溪县| 井冈山市| 茂名市| 进贤县| 剑阁县| 南漳县| 镇巴县| 永州市| 灵石县| 舒兰市| 桐乡市| 天门市| 陆河县| 兴义市| 西青区| 新宾| 门源| 中方县| 望谟县| 光山县| 普兰店市| 克山县| 文山县| 夏津县| 朝阳县| 酒泉市| 余干县| 江达县| 荣成市| 巍山| 阳东县| 凌源市| 石棉县| 桃园市| 新沂市| 德兴市| 邹平县| 长兴县| 星子县| 无为县|