學海拾遺

          生活、技術、思想無處不在學習
          posts - 52, comments - 23, trackbacks - 0, articles - 3
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          開發自己的搜索引擎---Lucene 2.0 + Heritrix

          Lucene2007-06-26.jpg


          【內容簡介】

          本書詳細介紹了如何應用Lucene進行搜索引擎開發,通過學習本書,讀者可以完成構建一個企業級的搜索引擎網站。.
          全書共分為14章,內容包括搜索引擎與信息檢索基礎,Lucene入門實例,Lucene索引的建立,使用Lucene構建搜索,Lucene的排序,Lucene的分析器,對Word、Excel和PDF格式文檔的解析,Compass搜索引擎框架,Lucene分布式和Google Search API,爬蟲Heritrix,綜合實例之準備篇,綜合實例之HTMLParser篇,綜合實例之DWR篇,綜合實例之Web編。..
          本書是國內第一本使用Lucene和Heritrix來講解搜索引擎構建的書,通過詳細的對API和源代碼的分析,力求使讀者在應用的基礎上,能夠深入其核心,自行擴展和開發相應組件,發揮想象力,開發出更具有創意的搜索引擎產品。本書適合Java程序員和從事計算機軟件開發的其他編程人員閱讀,同時也可以作為搜索引擎愛好者的入門書籍。
          由于目前市面上從技術層面介紹搜索引擎的書并不多,即使有,也大多停留在理論階段,而非搜索引擎的開發過程。因此,可以說本書是國內第一本詳細介紹搜索引擎開發過程的圖書。
          (1)采用最新的Lucene 2.0。以前大家用的1.4.3版本,而最新的Lucene 2.0重寫了很多API,內部的實現方法也有了很大優化。本書的代碼都是在2.0版本下調試通過的,這樣可以幫助讀者了解Lucene的更多新功能。
          (2)配有一個完整的搜索引擎案例。這個案例有很強的實用價值,只需稍加修改,就能應用于實際項目,市場價值在30000元以上!
          (3)著重解決開發人員頭痛的問題。本書的目的是指導項目實踐,因此沒有羅列各個API的用法,而是對常見的開發問題進行深入探討,比如本書的第7章,是專門為解決“Word,Excel和PDF文件如何解析”這個問題而設置的。
          (4)內容新穎,前衛實用。本書介紹了Compass、Heritrix、DWR和HTMLParser等內容。在搜索引擎開發的過程中,這些均為相當重要且實用的技術,筆者經過自身實踐將它們展現給讀者,希望能讓讀者在學習Lucene的同時開拓視野。
          光盤特色:
          配有一個完整的搜索引擎案例。這個案例有很強的實用價值,只需稍加修改,就能應用于實際項目,市場價值在30000元以上!...

          [后注]:
          ???一直以來都對搜索引擎很有興趣的,最近在學習JAVA,看到了Lucene,所以就找了一下,覺得這本書應該還可以的。只是苦于一直沒有可靠的經濟來源,所以再等一會,看能不能等到電子版哦。唉,這樣子偷偷摸摸地好苦啊!


          評論

          # re: 想看的書--->[未登錄]  回復  更多評論   

          2009-01-04 18:41 by qin
          如果你有了能給我發一份嗎?謝謝.我也等了,也找了很久了.04330310@163.com

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 黔西| 昭平县| 平乐县| 固原市| 集安市| 乐都县| 新平| 柯坪县| 同江市| 霍山县| 轮台县| 高密市| 德阳市| 雅江县| 克什克腾旗| 舒兰市| 武川县| 库伦旗| 黑龙江省| 苏尼特右旗| 潮州市| 始兴县| 潼关县| 台东市| 大余县| 安溪县| 旅游| 建水县| 蕉岭县| 吴桥县| 阿勒泰市| 红安县| 霍山县| 芷江| 江安县| 阳高县| 郎溪县| 永顺县| 搜索| 闸北区| 平湖市|