大漠駝鈴

          置身浩瀚的沙漠,方向最為重要,希望此blog能向大漠駝鈴一樣,給我方向和指引。
          Java,Php,Shell,Python,服務(wù)器運(yùn)維,大數(shù)據(jù),SEO, 網(wǎng)站開(kāi)發(fā)、運(yùn)維,云服務(wù)技術(shù)支持,IM服務(wù)供應(yīng)商, FreeSwitch搭建,技術(shù)支持等. 技術(shù)討論QQ群:428622099
          隨筆 - 238, 文章 - 3, 評(píng)論 - 117, 引用 - 0
          數(shù)據(jù)加載中……

          搜索服務(wù)

          Lucene等
          Lucene 索引數(shù)據(jù)庫(kù)2
               摘要: Lucene,作為一種全文搜索的輔助工具,為我們進(jìn)行條件搜索,無(wú)論是像Google,Baidu之類(lèi)的搜索引擎,還是論壇中的搜索功能,還是其它 C/S架構(gòu)的搜索,都帶來(lái)了極大的便利和比較高的效率。本文主要是利用Lucene對(duì)MS Sql Server 2000進(jìn)行建立索引,然后進(jìn)行全文索引。至于數(shù)據(jù)庫(kù)的內(nèi)容,可以是網(wǎng)頁(yè)的內(nèi)容,還是其它的。本文中數(shù)據(jù)庫(kù)的內(nèi)容是圖書(shū)館管理系統(tǒng)中的某個(gè)作者表-Authors表。

            因?yàn)榭紤]到篇幅的問(wèn)題,所以該文不會(huì)講的很詳細(xì),也不可能講的很深。

            本文以這樣的結(jié)構(gòu)進(jìn)行:

            1.介紹數(shù)據(jù)庫(kù)中Authors表的結(jié)構(gòu)

            2.為數(shù)據(jù)庫(kù)建立索引

            3.為數(shù)據(jù)庫(kù)建立查詢功能

            4.在web界面下進(jìn)行查詢并顯示結(jié)果

            1.介紹數(shù)據(jù)庫(kù)中Authors表的結(jié)構(gòu)

          字段名稱(chēng) 字段類(lèi)型 字段含義

          Au_id Varchar(11) 作者號(hào) 閱讀全文

          posted @ 2009-03-03 16:01 草原上的駱駝 閱讀(295) | 評(píng)論 (0)  編輯

          用Lucene索引數(shù)據(jù)庫(kù)
               摘要: (轉(zhuǎn))http://www.wujianrong.com/archives/2007/03/lucene_7.html
          1.寫(xiě)一段傳統(tǒng)的JDBC程序,講每條的用戶信息從數(shù)據(jù)庫(kù)讀取出來(lái)
          2.針對(duì)每條用戶記錄,建立一個(gè)lucene document
          Document doc = new Document();
          并根據(jù)你的需要,將用戶信息的各個(gè)字段對(duì)應(yīng)luncene document中的field 進(jìn)行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫(kù)
          3.編寫(xiě)對(duì)索引庫(kù)的搜索程序(看lucene文檔),通過(guò)對(duì)lucene的索引庫(kù)的查找,你可以快速找到對(duì)應(yīng)記錄的ID
          4.通過(guò)ID到數(shù)據(jù)庫(kù)中查找相關(guān)記錄   閱讀全文

          posted @ 2009-03-03 15:57 草原上的駱駝 閱讀(744) | 評(píng)論 (0)  編輯

          Lucene索引查詢分頁(yè)實(shí)例
               摘要: 一、輸入關(guān)鍵字的lucene.html



          請(qǐng)輸入關(guān)鍵字:



            閱讀全文

          posted @ 2009-03-03 15:56 草原上的駱駝 閱讀(1382) | 評(píng)論 (0)  編輯

          Lucene基本使用介紹
               摘要:

          本文的目的不在于對(duì)Lucene的概念和設(shè)計(jì)這些進(jìn)行介紹,僅在于介紹怎么樣去使用Lucene來(lái)達(dá)到自己想要的幾種常見(jiàn)的全文檢索的需求,如果想深入了解 Lucene的話本文不會(huì)帶給你什么收獲的。看完本文后想更深入的了解Lucene請(qǐng)?jiān)L問(wèn):http://lucene.apache.org

          一. 概述

          隨著系統(tǒng)信息的越來(lái)越多,怎么樣從這些信息海洋中撈起自己想要的那一根針就變得非常重要了,全文檢索是通常用于解決此類(lèi)問(wèn)題的方案,而Lucene則為實(shí)現(xiàn)全文檢索的工具,任何應(yīng)用都可通過(guò)嵌入它來(lái)實(shí)現(xiàn)全文檢索。

          二. 環(huán)境搭建

          從lucene.apache.org上下載最新版本的lucene.jar,將此jar作為項(xiàng)目的build path,那么在項(xiàng)目中就可以直接使用lucene了。

          三. 使用說(shuō)明

          3.1. 基本概念

          這里介紹的主要為在使用中經(jīng)常碰到一些概念,以大家都比較熟悉的數(shù)據(jù)庫(kù)來(lái)進(jìn)行類(lèi)比的講解,使用Lucene進(jìn)行全文檢索的過(guò)程有點(diǎn)類(lèi)似數(shù)據(jù)庫(kù)  閱讀全文

          posted @ 2009-03-03 11:35 草原上的駱駝 閱讀(295) | 評(píng)論 (0)  編輯

          為lucene加入簡(jiǎn)單中文分詞
               摘要: 看到很多人做lucene的應(yīng)用時(shí)候都要面臨中文分詞怎么加的問(wèn)題,下面介紹一個(gè)簡(jiǎn)單的中文詞庫(kù),這個(gè)詞庫(kù)附帶相應(yīng)的算法,數(shù)據(jù)結(jié)構(gòu)學(xué)過(guò)的人看懂沒(méi)什么問(wèn)題,只要簡(jiǎn)單的構(gòu)造一個(gè)對(duì)象,就可以分詞了,對(duì)于不是太大的應(yīng)用來(lái)說(shuō),還是相當(dāng)可行的,點(diǎn)擊下載  閱讀全文

          posted @ 2009-03-03 11:34 草原上的駱駝 閱讀(284) | 評(píng)論 (0)  編輯

          用Lucene檢索數(shù)據(jù)庫(kù)
               摘要: 1.寫(xiě)一段傳統(tǒng)的JDBC程序,講每條的用戶信息從數(shù)據(jù)庫(kù)讀取出來(lái)
          2.針對(duì)每條用戶記錄,建立一個(gè)lucene document
          Document doc = new Document();
          并根據(jù)你的需要,將用戶信息的各個(gè)字段對(duì)應(yīng)luncene document中的field 進(jìn)行添加,如:
          doc.add(new Field("NAME","USERNAME",Field.Store.YES,Field.Index.UN_TOKENIZED));
          然后將該條doc加入到索引中, 如: luceneWriter.addDocument(doc);
          這樣就建立了lucene的索引庫(kù)
          3.編寫(xiě)對(duì)索引庫(kù)的搜索程序(看lucene文檔),通過(guò)對(duì)lucene的索引庫(kù)的查找,你可以快速找到對(duì)應(yīng)記錄的ID
          4.通過(guò)ID到數(shù)據(jù)庫(kù)中查找相關(guān)記錄   閱讀全文

          posted @ 2009-03-03 11:33 草原上的駱駝 閱讀(2882) | 評(píng)論 (1)  編輯

          Lucene全文檢索實(shí)踐
               摘要: Lucene 是 Apache 的一個(gè)子項(xiàng)目,是一個(gè)全文檢索的搜索引擎庫(kù)。其提供了簡(jiǎn)單實(shí)用的 API,通過(guò)這些 API,可以自行編寫(xiě)對(duì)文件(TEXT/XML/HTML等)、目錄、數(shù)據(jù)庫(kù)的全文檢索程序。

          Features:
          * Very fast indexing, minimal RAM required
          * Index compression to 30% of original text
          * Indexes text and HTML, document classes available for XML, PDF and RTF
          * Search supports phrase and Boolean queries, plus, minus and quote marks, and parentheses
          * Allows single and multiple character wildcards anywhere in the search words, fuzzy search, proximity
          *  閱讀全文

          posted @ 2009-03-03 11:31 草原上的駱駝 閱讀(1970) | 評(píng)論 (10)  編輯

          主站蜘蛛池模板: 陇西县| 常山县| 红桥区| 兴文县| 黄浦区| 二手房| 东方市| 河津市| 天门市| 双桥区| 沙洋县| 天津市| 界首市| 分宜县| 南汇区| 蕲春县| 繁昌县| 白城市| 泰来县| 温州市| 来安县| 黑龙江省| 长子县| 正镶白旗| 吉木萨尔县| 日照市| 衢州市| 前郭尔| 麟游县| 西畴县| 长治市| 万宁市| 琼中| 上杭县| 崇州市| 丹东市| 益阳市| 西乡县| 桃园县| 清河县| 乐东|