網站:JavaEye 作者:yuping322 發表時間: 2007-08-24 20:26 此文章來自于 http://www.JavaEye.com
聲明:本文系JavaEye網站原創文章,未經JavaEye網站或者作者本人書面許可,任何其他網站嚴禁擅自發表本文,否則必將追究法律責任!
原文鏈接: http://yuping.javaeye.com/blog/116248
信息采集系統的技術實現 信息采集系統指的是按標準格式采集指定網絡信息,同搜索引擎的區別在于其采集的目的性更強,采集源范圍也比較小。這里簡單介紹一下信息采集系統實現上的幾個關鍵問題: 1) 采集網頁數據 2) 如何按關鍵字來信息 3) 網頁中的鏈結獲取算法 4) 無效數據的過濾 5) 特定數據的獲取算法 信息采集的整個流程可總結如下: a) 首先,獲取網頁的完整信息 |
《 信息采集系統的技術實現 》 的評論也很精彩,歡迎您也添加評論。查看詳細 >>
JavaEye推薦
上海樂福狗信息技術有限公司:誠聘技術經理和開發工程師
免費下載IBM社區版軟件--它基于開放的標準,支持廣泛的開發類型,讓您的開發高效自主!
京滬穗蓉四地免費注冊,SOA技術高手匯聚交鋒.
上海:優秀公司德比:高薪誠聘 資深Java工程師
廣州:優易公司:誠聘Java工程師,開發經理
上海:尤恩斯國際集團:誠聘開發工程師
北京:優秀公司NHNChina招聘:WEB開發,系統管理,JAVA開發, DBA
文章來源: http://yuping.javaeye.com/blog/116248