愛技術(shù)愛生活

          愛生活

          常用鏈接

          統(tǒng)計(jì)

          最新評(píng)論

          Lucene從基礎(chǔ)到實(shí)戰(zhàn)高級(jí)應(yīng)用(附帶Lucene+Struts2+Spring+IBatis實(shí)現(xiàn)華電內(nèi)部搜索項(xiàng)目案例)

          本課程在線學(xué)習(xí)地址:http://v.youku.com/v_show/id_XMTE5Mjk5MzQ0.html

          課程特色:
          理論結(jié)合實(shí)踐!每講前部分先將理論,然后用代碼去完全理論的實(shí)踐

          Lucene課程大綱:
          1. Lucene概述
          1.1 課程概述
          1.2 認(rèn)識(shí)Lucene
          1.3 Lucene的經(jīng)典應(yīng)用
          1.4 Lucene基本開發(fā)環(huán)境配置
          2. Lucene系統(tǒng)架構(gòu)
          2.1 Lucene的特點(diǎn)
          2.2 核心包及其功能介紹
          2.3 Lucene核心索引類介紹
          2.4 Lucene核心搜索類介紹
          2.5 Lucene與關(guān)系數(shù)據(jù)庫(kù)
          2.6 Lucene內(nèi)部實(shí)現(xiàn)原理
          3. 索引
          3.1 為什么要用索引
          3.2 Lucene索引的優(yōu)越性
          3.3 Lucene索引建立
          3.4 利用Lucene組件建立索引
          3.5 刪除Document
          3.6 恢復(fù)刪除
          3.7 Document更新操作
          3.8 使用RamDirectory
          3.9 Document的Boost設(shè)置
          3.10 索引優(yōu)化
          4. 搜索
          4.1 簡(jiǎn)單搜索的實(shí)現(xiàn)
          4.1.1 指定字段的搜索
          4.1.2 ScoreDoc的運(yùn)用
          4.2 Query類的使用
          4.2.1 搜索中使用TermQuery
          4.2.2 搜索中使用RangeQuery
          4.2.3 搜索中使用PreFixQuery
          4.2.4 搜索中使用FuzzyQuery
          4.2.5 搜索中使用WilcardQuery
          4.2.6 搜索中使用BooleanQuery
          4.4分頁(yè)搜索的實(shí)現(xiàn)
          4.3 QueryParser類的使用
          4.3.1 默認(rèn)的字段中檢索
          4.3.2 搜索中運(yùn)用邏輯運(yùn)算
          4.3.3 前綴搜索和模糊搜索
          4.3搜索的總結(jié)
          5 分詞
          5.1 分詞的基本原理
          5.2 Lucene分詞器的使用
          5.3 中文分詞
          5.3.1 中文分詞的基本原理
          5.3.2 優(yōu)秀中文分詞器介紹
          5.3.3在搜索中使用中文分詞器
          6. 解析文檔
          6.1 XML文件的索引
          6.1.1 了解XPath
          6.1.2 XML解析
          6.2 PDF文檔的索引
          6.1 使用PDFBox處理PDF文檔 
          6.2 使用xpdf來(lái)處理中文PDF文檔 
          6.3 HTML文檔索引
          6.3.1 獲取HTML源文檔
          6.3.2 使用JTidy
          6.3.2 使用NekoHTML
          6.3.3 使用HttpClient
          6.3.4 使用HTMLParser
          6.4 Word文檔的索引
          6.4.1 POI對(duì)Word的處理類 
          6.4.2 使用Jacob來(lái)處理Word文檔 
          7. 高亮
          7.1 高亮的基本原理
          7.2 在搜索中使用高亮
          8. 網(wǎng)絡(luò)爬蟲Heritrix 
          8.1 Heritrix使用入門 
          8.2 Heritrix的架構(gòu) 
          8.3 Heritrix的應(yīng)用 
          9項(xiàng)目實(shí)戰(zhàn)-華電企業(yè)內(nèi)部文檔搜索系統(tǒng)(項(xiàng)目截圖稍后公布)
          9.1 需求說(shuō)明
          9.2 系統(tǒng)架構(gòu)介紹
          9.2.1 技術(shù)方案的選擇
          9.2.2 使用Ibatis
          9.3 系統(tǒng)模塊分析
          9.4 系統(tǒng)開發(fā)

          項(xiàng)目涉及技術(shù)點(diǎn)和內(nèi)容:
          知識(shí)范圍:
          全文檢索,倒排索引,中文分詞,爬蟲,文檔解析,ibatis等
          技術(shù)選型:
          Lucene+Struts2+Spring+IBatis
          項(xiàng)目?jī)r(jià)值:
          本項(xiàng)目是企業(yè)級(jí)的搜索系統(tǒng),既可以自成體系,拿出來(lái)作為一個(gè)單獨(dú)的系統(tǒng)里來(lái)使用;也可以集成到其他現(xiàn)有的系統(tǒng)中,成為其他系統(tǒng)的一個(gè)重要的模塊(現(xiàn)在很多網(wǎng)站內(nèi)部都集成了一個(gè)全文檢索系統(tǒng),很多OA系統(tǒng)都有一個(gè)全文檢索系統(tǒng))。

          項(xiàng)目配套截圖:

           

          posted on 2009-09-24 17:54 吃奶的孩子 閱讀(3015) 評(píng)論(2)  編輯  收藏

          評(píng)論

          # re: Lucene從基礎(chǔ)到實(shí)戰(zhàn)高級(jí)應(yīng)用(附帶Lucene+Struts2+Spring+IBatis實(shí)現(xiàn)華電內(nèi)部搜索項(xiàng)目案例) 2010-10-04 09:41 威爾

          誰(shuí)有視頻聯(lián)系我:634623907  回復(fù)  更多評(píng)論   

          # re: Lucene從基礎(chǔ)到實(shí)戰(zhàn)高級(jí)應(yīng)用(附帶Lucene+Struts2+Spring+IBatis實(shí)現(xiàn)華電內(nèi)部搜索項(xiàng)目案例) 2013-10-29 12:06 fendouhuazi

          想看看,感覺挺不錯(cuò)的@威爾
            回復(fù)  更多評(píng)論   


          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 西宁市| 哈尔滨市| 福建省| 南溪县| 常宁市| 林口县| 福鼎市| 天气| 衡山县| 连云港市| 巴塘县| 新泰市| 卢龙县| 东乌珠穆沁旗| 嘉祥县| 南澳县| 太白县| 本溪市| 潜山县| 九江市| 海伦市| 南澳县| 商南县| 白银市| 舒兰市| 安国市| 黄陵县| 韩城市| 成武县| 邓州市| 根河市| 崇信县| 微山县| 合作市| 松江区| 吴旗县| 枣庄市| 自治县| 太原市| 上杭县| 祁阳县|