Krabber 0.0.0.2版本發(fā)布
Krabber是用于抽取網(wǎng)頁中HTML信息的工具。最為重要的是,Krabber可以執(zhí)行網(wǎng)頁中的JavaScript,并網(wǎng)頁在JavaScript執(zhí)行后的,被修改的HTML返回回來,提供給Java程序調(diào)用,以便能夠更好的支持Web 2.0環(huán)境下的網(wǎng)頁信息抓取。
啊列啊列,經(jīng)過了超長(zhǎng)時(shí)間的掙扎,終于做好了第一個(gè)可以運(yùn)行的版本。參與項(xiàng)目開發(fā)的同學(xué)從對(duì)C++與Java完全不了解到逐漸的熟悉并開始進(jìn)步,實(shí)在是相當(dāng)不容易啊,贊一個(gè)。我本科的時(shí)候要是有這個(gè)水平,沒準(zhǔn)現(xiàn)在就牛X了。
比較慚愧的是,由于涉足開源領(lǐng)域的經(jīng)驗(yàn)不足,沒有很好的整理文檔以及代碼。目前Krabber已經(jīng)可以下載了,可以嘗試著在Windows下用VS編譯一下,看看能不能行。另外可以運(yùn)行的EXE也應(yīng)該會(huì)快回上傳上來。
另外昨天開會(huì)的時(shí)候同學(xué)們表示,我們小組的博客好像不太容易看懂。這個(gè)沒辦法啦,沒有時(shí)間做網(wǎng)站和找主機(jī),只能用博客充當(dāng)在線內(nèi)容編輯器了。大家在看我們的博客的時(shí)候請(qǐng)把它當(dāng)成網(wǎng)站來看,相關(guān)的鏈接都在博客正文中黃色的標(biāo)題下面,至于博客正文周邊的連接就無視好了……
Krabber在http://www.aygfsteel.com/senior/archive/2009/05/10/269916.html
(by : 雞叔 : senior, sakaekutitubasa@gmail.com)
posted on 2009-05-11 08:14 Senior 閱讀(1747) 評(píng)論(2) 編輯 收藏 所屬分類: Misc