老妖的博客
          現(xiàn)實(shí)的中沒(méi)有幾個(gè)人能夠真為對(duì)方去死,甚至山盟海誓很快就會(huì)在金錢面前變的微不足道,這才是生活。沒(méi)有永遠(yuǎn)的愛(ài),除了你的父母對(duì)你,當(dāng)然也就沒(méi)有永遠(yuǎn)的恨,更沒(méi)有永遠(yuǎn)的痛,時(shí)間是最好的治療大師,它會(huì)很快撫平你心靈上累累的傷痕。很多年以后你想起來(lái)時(shí),那些在你生命中洶涌來(lái)往的人群至多是個(gè)模糊的影子或者毫無(wú)意義的名字
          posts - 105,  comments - 171,  trackbacks - 0
          很久以前寫過(guò)一篇文章利用htmlparser抓取網(wǎng)頁(yè)內(nèi)容(一),很多人都提問(wèn)他的詳細(xì)使用,其實(shí)我也只是入門嘗試,如果想深入使用,還是建議看官方文檔或者測(cè)試用例。不過(guò)最近剛好有個(gè)朋友想再次解析第三方網(wǎng)頁(yè)內(nèi)容,來(lái)查看交通違章信息。無(wú)意中發(fā)現(xiàn)一個(gè)比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持類jquery語(yǔ)法,對(duì),你沒(méi)看錯(cuò),是jquery選擇器語(yǔ)法。下載地址:http://jsoup.org/
          詳細(xì)使用文檔,這個(gè)地址應(yīng)該說(shuō)的很清楚了:http://baike.baidu.com/view/4066913.htm
          使用非常簡(jiǎn)單,示例如下(是讀取山西交通違章信息):
           1 import java.util.HashMap;
           2 import java.util.Map;
           3 
           4 import org.jsoup.Jsoup;
           5 import org.jsoup.nodes.Document;
           6 import org.jsoup.select.Elements;
           7 /**
           8  * 
           9  * @author Rocky
          10  *
          11  */
          12 public class spider {
          13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
          14     private void spiderData() throws Exception{
          15          Map<String,String> req=new HashMap<String,String>();
          16          req.put("authCode", "");
          17          req.put("csjcKey","110000");
          18          req.put("hpzl", "02");
          19          req.put("vioViolation.hphm", "xxx");//您的車牌號(hào)
          20          req.put("type","1");
          21          req.put("pagination.currentPage", "1");
          22          req.put("pagination.pageSize", "5");
          23          
          24          Document doc=Jsoup.connect(POSTURL).data(req).get();
          25          Elements newsHeadlines=doc.select(".if_tr td");
          26          System.out.println(newsHeadlines.text());
          27     }
          28     /**
          29      * @param args
          30      * @throws Exception 
          31      */
          32     public static void main(String[] args) throws Exception {
          33         
          34         spider spider=new spider();
          35         spider.spiderData();
          36     }
          37 
          38 }
          posted on 2013-08-07 13:25 老妖 閱讀(5915) 評(píng)論(4)  編輯  收藏 所屬分類: java心得

          FeedBack:
          # re: HTML Parser 替代品 jsoup
          2013-08-07 13:32 | 老妖
          修正了一下,發(fā)現(xiàn)jsoup可以使用connect直接發(fā)起http請(qǐng)求,并且可附加map參數(shù)類型,所以廢棄了apache httpclient封裝  回復(fù)  更多評(píng)論
            
          # re: HTML Parser 替代品 jsoup
          2013-08-15 14:59 | jun
          @老妖
          表單數(shù)據(jù)怎么設(shè)置  回復(fù)  更多評(píng)論
            
          # HTML Parser 替代品 jsoup
          2013-08-16 15:21 | 合肥期貨開(kāi)戶
          jquery選擇器語(yǔ)法是什么東東,下下來(lái)看看好不好用先。  回復(fù)  更多評(píng)論
            
          # re: HTML Parser 替代品 jsoup[未登錄](méi)
          2013-08-17 15:27 | 老妖
          @ jun
          表單的數(shù)據(jù)就是我代碼中寫的map數(shù)據(jù)。你注意看看我的文章中含的外鏈。看文章不仔細(xì)  回復(fù)  更多評(píng)論
            

          <2013年8月>
          28293031123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          隨筆分類(48)

          隨筆檔案(104)

          好友鏈接

          我的豆瓣

          積分與排名

          • 積分 - 221799
          • 排名 - 257

          最新評(píng)論

          閱讀排行榜

          主站蜘蛛池模板: 临汾市| 堆龙德庆县| 长治市| 东至县| 忻州市| 冀州市| 安塞县| 平江县| 连平县| 岫岩| 忻城县| 苍山县| 西吉县| 夏河县| 仲巴县| 桃园县| 华阴市| 三都| 泗阳县| 赣州市| 固阳县| 洛隆县| 盐源县| 庄河市| 塔城市| 西畴县| 青冈县| 凭祥市| 灵寿县| 额敏县| 沾化县| 宜良县| 南京市| 渑池县| 灵台县| 称多县| 阿坝| 阿合奇县| 东阿县| 淮北市| 茶陵县|