學海拾遺

          生活、技術、思想無處不在學習
          posts - 52, comments - 23, trackbacks - 0, articles - 3
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          開發自己的搜索引擎---Lucene 2.0 + Heritrix

          Lucene2007-06-26.jpg


          【內容簡介】

          本書詳細介紹了如何應用Lucene進行搜索引擎開發,通過學習本書,讀者可以完成構建一個企業級的搜索引擎網站。.
          全書共分為14章,內容包括搜索引擎與信息檢索基礎,Lucene入門實例,Lucene索引的建立,使用Lucene構建搜索,Lucene的排序,Lucene的分析器,對Word、Excel和PDF格式文檔的解析,Compass搜索引擎框架,Lucene分布式和Google Search API,爬蟲Heritrix,綜合實例之準備篇,綜合實例之HTMLParser篇,綜合實例之DWR篇,綜合實例之Web編。..
          本書是國內第一本使用Lucene和Heritrix來講解搜索引擎構建的書,通過詳細的對API和源代碼的分析,力求使讀者在應用的基礎上,能夠深入其核心,自行擴展和開發相應組件,發揮想象力,開發出更具有創意的搜索引擎產品。本書適合Java程序員和從事計算機軟件開發的其他編程人員閱讀,同時也可以作為搜索引擎愛好者的入門書籍。
          由于目前市面上從技術層面介紹搜索引擎的書并不多,即使有,也大多停留在理論階段,而非搜索引擎的開發過程。因此,可以說本書是國內第一本詳細介紹搜索引擎開發過程的圖書。
          (1)采用最新的Lucene 2.0。以前大家用的1.4.3版本,而最新的Lucene 2.0重寫了很多API,內部的實現方法也有了很大優化。本書的代碼都是在2.0版本下調試通過的,這樣可以幫助讀者了解Lucene的更多新功能。
          (2)配有一個完整的搜索引擎案例。這個案例有很強的實用價值,只需稍加修改,就能應用于實際項目,市場價值在30000元以上!
          (3)著重解決開發人員頭痛的問題。本書的目的是指導項目實踐,因此沒有羅列各個API的用法,而是對常見的開發問題進行深入探討,比如本書的第7章,是專門為解決“Word,Excel和PDF文件如何解析”這個問題而設置的。
          (4)內容新穎,前衛實用。本書介紹了Compass、Heritrix、DWR和HTMLParser等內容。在搜索引擎開發的過程中,這些均為相當重要且實用的技術,筆者經過自身實踐將它們展現給讀者,希望能讓讀者在學習Lucene的同時開拓視野。
          光盤特色:
          配有一個完整的搜索引擎案例。這個案例有很強的實用價值,只需稍加修改,就能應用于實際項目,市場價值在30000元以上!...

          [后注]:
          ???一直以來都對搜索引擎很有興趣的,最近在學習JAVA,看到了Lucene,所以就找了一下,覺得這本書應該還可以的。只是苦于一直沒有可靠的經濟來源,所以再等一會,看能不能等到電子版哦。唉,這樣子偷偷摸摸地好苦啊!


          評論

          # re: 想看的書--->[未登錄]  回復  更多評論   

          2009-01-04 18:41 by qin
          如果你有了能給我發一份嗎?謝謝.我也等了,也找了很久了.04330310@163.com

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 华宁县| 营口市| 平凉市| 尖扎县| 深圳市| 旬邑县| 庐江县| 团风县| 城固县| 阿坝县| 青神县| 林周县| 尼玛县| 崇左市| 黑水县| 湖北省| 克什克腾旗| 惠安县| 南京市| 嘉荫县| 兰州市| 民县| 塔河县| 丹棱县| 晋城| 巫溪县| 屯留县| 盐津县| 辽阳县| 远安县| 稻城县| 紫云| 凉城县| 洛阳市| 海丰县| 邹城市| 浏阳市| 顺昌县| 故城县| 社会| 西昌市|