大漠駝鈴

          置身浩瀚的沙漠,方向最為重要,希望此blog能向大漠駝鈴一樣,給我方向和指引。
          Java,Php,Shell,Python,服務(wù)器運維,大數(shù)據(jù),SEO, 網(wǎng)站開發(fā)、運維,云服務(wù)技術(shù)支持,IM服務(wù)供應商, FreeSwitch搭建,技術(shù)支持等. 技術(shù)討論QQ群:428622099
          隨筆 - 238, 文章 - 3, 評論 - 117, 引用 - 0
          數(shù)據(jù)加載中……

          搜索服務(wù)

          Lucene等
          Lucene 索引數(shù)據(jù)庫2
               摘要: Lucene,作為一種全文搜索的輔助工具,為我們進行條件搜索,無論是像Google,Baidu之類的搜索引擎,還是論壇中的搜索功能,還是其它 C/S架構(gòu)的搜索,都帶來了極大的便利和比較高的效率。本文主要是利用Lucene對MS Sql Server 2000進行建立索引,然后進行全文索引。至于數(shù)據(jù)庫的內(nèi)容,可以是網(wǎng)頁的內(nèi)容,還是其它的。本文中數(shù)據(jù)庫的內(nèi)容是圖書館管理系統(tǒng)中的某個作者表-Authors表。

            因為考慮到篇幅的問題,所以該文不會講的很詳細,也不可能講的很深。

            本文以這樣的結(jié)構(gòu)進行:

            1.介紹數(shù)據(jù)庫中Authors表的結(jié)構(gòu)

            2.為數(shù)據(jù)庫建立索引

            3.為數(shù)據(jù)庫建立查詢功能

            4.在web界面下進行查詢并顯示結(jié)果

            1.介紹數(shù)據(jù)庫中Authors表的結(jié)構(gòu)

          字段名稱 字段類型 字段含義

          Au_id Varchar(11) 作者號 閱讀全文

          posted @ 2009-03-03 16:01 草原上的駱駝 閱讀(290) | 評論 (0)  編輯

          用Lucene索引數(shù)據(jù)庫
               摘要: (轉(zhuǎn))http://www.wujianrong.com/archives/2007/03/lucene_7.html
          1.寫一段傳統(tǒng)的JDBC程序,講每條的用戶信息從數(shù)據(jù)庫讀取出來
          2.針對每條用戶記錄,建立一個lucene document
          Document doc = new Document();
          并根據(jù)你的需要,將用戶信息的各個字段對應luncene document中的field 進行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫
          3.編寫對索引庫的搜索程序(看lucene文檔),通過對lucene的索引庫的查找,你可以快速找到對應記錄的ID
          4.通過ID到數(shù)據(jù)庫中查找相關(guān)記錄   閱讀全文

          posted @ 2009-03-03 15:57 草原上的駱駝 閱讀(731) | 評論 (0)  編輯

          Lucene索引查詢分頁實例
               摘要: 一、輸入關(guān)鍵字的lucene.html



          請輸入關(guān)鍵字:



            閱讀全文

          posted @ 2009-03-03 15:56 草原上的駱駝 閱讀(1376) | 評論 (0)  編輯

          Lucene基本使用介紹
               摘要:

          本文的目的不在于對Lucene的概念和設(shè)計這些進行介紹,僅在于介紹怎么樣去使用Lucene來達到自己想要的幾種常見的全文檢索的需求,如果想深入了解 Lucene的話本文不會帶給你什么收獲的。看完本文后想更深入的了解Lucene請訪問:http://lucene.apache.org

          一. 概述

          隨著系統(tǒng)信息的越來越多,怎么樣從這些信息海洋中撈起自己想要的那一根針就變得非常重要了,全文檢索是通常用于解決此類問題的方案,而Lucene則為實現(xiàn)全文檢索的工具,任何應用都可通過嵌入它來實現(xiàn)全文檢索。

          二. 環(huán)境搭建

          從lucene.apache.org上下載最新版本的lucene.jar,將此jar作為項目的build path,那么在項目中就可以直接使用lucene了。

          三. 使用說明

          3.1. 基本概念

          這里介紹的主要為在使用中經(jīng)常碰到一些概念,以大家都比較熟悉的數(shù)據(jù)庫來進行類比的講解,使用Lucene進行全文檢索的過程有點類似數(shù)據(jù)庫  閱讀全文

          posted @ 2009-03-03 11:35 草原上的駱駝 閱讀(287) | 評論 (0)  編輯

          為lucene加入簡單中文分詞
               摘要: 看到很多人做lucene的應用時候都要面臨中文分詞怎么加的問題,下面介紹一個簡單的中文詞庫,這個詞庫附帶相應的算法,數(shù)據(jù)結(jié)構(gòu)學過的人看懂沒什么問題,只要簡單的構(gòu)造一個對象,就可以分詞了,對于不是太大的應用來說,還是相當可行的,點擊下載  閱讀全文

          posted @ 2009-03-03 11:34 草原上的駱駝 閱讀(278) | 評論 (0)  編輯

          用Lucene檢索數(shù)據(jù)庫
               摘要: 1.寫一段傳統(tǒng)的JDBC程序,講每條的用戶信息從數(shù)據(jù)庫讀取出來
          2.針對每條用戶記錄,建立一個lucene document
          Document doc = new Document();
          并根據(jù)你的需要,將用戶信息的各個字段對應luncene document中的field 進行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫
          3.編寫對索引庫的搜索程序(看lucene文檔),通過對lucene的索引庫的查找,你可以快速找到對應記錄的ID
          4.通過ID到數(shù)據(jù)庫中查找相關(guān)記錄   閱讀全文

          posted @ 2009-03-03 11:33 草原上的駱駝 閱讀(2870) | 評論 (1)  編輯

          Lucene全文檢索實踐
               摘要: Lucene 是 Apache 的一個子項目,是一個全文檢索的搜索引擎庫。其提供了簡單實用的 API,通過這些 API,可以自行編寫對文件(TEXT/XML/HTML等)、目錄、數(shù)據(jù)庫的全文檢索程序。

          Features:
          * Very fast indexing, minimal RAM required
          * Index compression to 30% of original text
          * Indexes text and HTML, document classes available for XML, PDF and RTF
          * Search supports phrase and Boolean queries, plus, minus and quote marks, and parentheses
          * Allows single and multiple character wildcards anywhere in the search words, fuzzy search, proximity
          *  閱讀全文

          posted @ 2009-03-03 11:31 草原上的駱駝 閱讀(1962) | 評論 (10)  編輯

          主站蜘蛛池模板: 新昌县| 仙桃市| 泸定县| 青田县| 洛宁县| 扎囊县| 英山县| 河曲县| 宜宾市| 赤峰市| 永安市| 祥云县| 科尔| 锡林郭勒盟| 滁州市| 大渡口区| 龙里县| 四会市| 汉川市| 灌云县| 太和县| 唐山市| 大厂| 铜川市| 大冶市| 汽车| 楚雄市| 阿荣旗| 宝鸡市| 祁东县| 西城区| 合作市| 常德市| 盐池县| 中牟县| 香格里拉县| 阿城市| 蕲春县| 盐亭县| 乃东县| 苍溪县|