Java心路

          Java、Eclipse、Ajax......一個都不能少

           

          我的畢設題目

              我的畢設題目是“基于able的互聯網分布式主題搜索技術研究”,重點研究了搜索引擎的兩個重要組成部分:網絡信息的搜索和網頁信息的抽取。所要設計實現的專利信息采集抽取系統可以讓我們及時地了解某類專利在一定時期的發展狀況,它是一個主題搜索引擎系統,包括專利網頁抓取和專利信息抽取兩個子系統。在專利網頁抓取子系統中,利用網絡爬行器,使用JSP腳本語言實現了原型系統的后端,即專利數據庫的選擇、查詢結果的返回以及網頁源文件的自動下載。在專利信息抽取子系統中,通過XML處理器和JTidy工具生成DOM樹,利用XSLT樣式表和XPath語句將下載到本地的HTML源文件轉換成XML文件,從中進行專利信息的提取,然后通過Oracle JDBC驅動進行入庫操作,最后利用IBM的able分布式軟件平臺將各種算法封裝成Agent,以供將來的分布式運行。只要對信息源進行足夠的分析工作,此系統可以應用在其它一些行業領域中,如股票價格查詢、新聞信息搜索等等。我的系統還有許多不成熟的地方,歡迎有這方面經驗的人與我一起探討共勉!
          qq:173635235 
          msn:bisal1130@yahoo.com.cn
          emails:bill1130@gmail.com & bill15@tom.com

          posted on 2006-06-25 13:18 bisal 閱讀(576) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          導航

          統計

          常用鏈接

          留言簿(4)

          隨筆檔案

          文章檔案

          相冊

          Java戰友兄弟

          常用技術交流平臺

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 冀州市| 齐齐哈尔市| 辽宁省| 奉节县| 教育| 庆云县| 祁门县| 清徐县| 雅安市| 呼图壁县| 徐州市| 安福县| 瑞金市| 汤阴县| 肥东县| 浙江省| 鄂尔多斯市| 丹阳市| 文水县| 同心县| 泽普县| 南雄市| 鹤山市| 遵义市| 社旗县| 石狮市| 太康县| 张家川| 辽阳县| 邓州市| 肥乡县| 高安市| 博客| 阿城市| 卢湾区| 宁国市| 江北区| 黑河市| 乌兰察布市| 来安县| 安远县|