Senior

          RESEARCH behind THINK beside CODE beyond

          Krabber 0.0.0.2版本發布

          Krabber是用于抽取網頁中HTML信息的工具。最為重要的是,Krabber可以執行網頁中的JavaScript,并網頁在JavaScript執行后的,被修改的HTML返回回來,提供給Java程序調用,以便能夠更好的支持Web 2.0環境下的網頁信息抓取。

          啊列啊列,經過了超長時間的掙扎,終于做好了第一個可以運行的版本。參與項目開發的同學從對C++與Java完全不了解到逐漸的熟悉并開始進步,實在是相當不容易啊,贊一個。我本科的時候要是有這個水平,沒準現在就牛X了。

          比較慚愧的是,由于涉足開源領域的經驗不足,沒有很好的整理文檔以及代碼。目前Krabber已經可以下載了,可以嘗試著在Windows下用VS編譯一下,看看能不能行。另外可以運行的EXE也應該會快回上傳上來。

          另外昨天開會的時候同學們表示,我們小組的博客好像不太容易看懂。這個沒辦法啦,沒有時間做網站和找主機,只能用博客充當在線內容編輯器了。大家在看我們的博客的時候請把它當成網站來看,相關的鏈接都在博客正文中黃色的標題下面,至于博客正文周邊的連接就無視好了……

          Krabber在http://www.aygfsteel.com/senior/archive/2009/05/10/269916.html

          (by : 雞叔 : senior, sakaekutitubasa@gmail.com)

          posted on 2009-05-11 08:14 Senior 閱讀(1747) 評論(2)  編輯  收藏 所屬分類: Misc

          Feedback

          # re: Krabber 0.0.0.2版本發布[未登錄] 2009-05-12 20:58 劉明

          以前公司讓做過個類似的東西,弄了一星期放棄了...

          你是用C++調用的IE吧?那還用Java干什么?只要能調用IE剩下的事情應該就比較好辦,我就是對Window下的IE調用和C++不太熟,比較失敗,哈哈...  回復  更多評論   

          # re: Krabber 0.0.0.2版本發布 2009-05-13 05:33 Senior

          @劉明

          謝謝關心我們的項目。

          Krabber只是整個kVitrail項目的網頁抽取部分。由于kVitrail的其他部分是用Java做的,并且實驗室幾乎所有的其他項目都是用Java寫的,因此為了保證這個部分能夠為其他項目提供服務才做出這種奇怪的決定的。

          主要的原因還是我們能力不足,其實Symphony既然可以把IE嵌入到應用中,那么直接通過Java調用IE應該也是可以的吧。只是目前我們還沒有學習到那么深入的部分,因此暫時只能采用這種比較笨的方法了。

          另外我只負責項目的管理,Krabber的具體的技術是pinlin同學負責研究和實現的。如果需要您可以和他聯系。pinlin168@tom.com

          (by: 雞叔 : senior, sakaekutitubasa@gmail.com)
            回復  更多評論   

          主站蜘蛛池模板: 浠水县| 清徐县| 肥东县| 龙海市| 泰顺县| 绥德县| 西青区| 石台县| 衡南县| 梓潼县| 措勤县| 长治县| 黄山市| 平罗县| 麻栗坡县| 龙门县| 咸丰县| 长岛县| 祁连县| 正安县| 新田县| 蕲春县| 博客| 荆州市| 金湖县| 榆中县| 昆山市| 天水市| 武鸣县| 宣化县| 于都县| 汉阴县| 怀宁县| 诸城市| 荥经县| 铜梁县| 台南市| 晋中市| 静安区| 肇源县| 临高县|