老妖的博客
          現(xiàn)實的中沒有幾個人能夠真為對方去死,甚至山盟海誓很快就會在金錢面前變的微不足道,這才是生活。沒有永遠(yuǎn)的愛,除了你的父母對你,當(dāng)然也就沒有永遠(yuǎn)的恨,更沒有永遠(yuǎn)的痛,時間是最好的治療大師,它會很快撫平你心靈上累累的傷痕。很多年以后你想起來時,那些在你生命中洶涌來往的人群至多是個模糊的影子或者毫無意義的名字
          posts - 105,  comments - 171,  trackbacks - 0
          很久以前寫過一篇文章利用htmlparser抓取網(wǎng)頁內(nèi)容(一),很多人都提問他的詳細(xì)使用,其實我也只是入門嘗試,如果想深入使用,還是建議看官方文檔或者測試用例。不過最近剛好有個朋友想再次解析第三方網(wǎng)頁內(nèi)容,來查看交通違章信息。無意中發(fā)現(xiàn)一個比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持類jquery語法,對,你沒看錯,是jquery選擇器語法。下載地址:http://jsoup.org/
          詳細(xì)使用文檔,這個地址應(yīng)該說的很清楚了:http://baike.baidu.com/view/4066913.htm
          使用非常簡單,示例如下(是讀取山西交通違章信息):
           1 import java.util.HashMap;
           2 import java.util.Map;
           3 
           4 import org.jsoup.Jsoup;
           5 import org.jsoup.nodes.Document;
           6 import org.jsoup.select.Elements;
           7 /**
           8  * 
           9  * @author Rocky
          10  *
          11  */
          12 public class spider {
          13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
          14     private void spiderData() throws Exception{
          15          Map<String,String> req=new HashMap<String,String>();
          16          req.put("authCode", "");
          17          req.put("csjcKey","110000");
          18          req.put("hpzl", "02");
          19          req.put("vioViolation.hphm", "xxx");//您的車牌號
          20          req.put("type","1");
          21          req.put("pagination.currentPage", "1");
          22          req.put("pagination.pageSize", "5");
          23          
          24          Document doc=Jsoup.connect(POSTURL).data(req).get();
          25          Elements newsHeadlines=doc.select(".if_tr td");
          26          System.out.println(newsHeadlines.text());
          27     }
          28     /**
          29      * @param args
          30      * @throws Exception 
          31      */
          32     public static void main(String[] args) throws Exception {
          33         
          34         spider spider=new spider();
          35         spider.spiderData();
          36     }
          37 
          38 }
          posted on 2013-08-07 13:25 老妖 閱讀(5899) 評論(4)  編輯  收藏 所屬分類: java心得

          FeedBack:
          # re: HTML Parser 替代品 jsoup
          2013-08-07 13:32 | 老妖
          修正了一下,發(fā)現(xiàn)jsoup可以使用connect直接發(fā)起http請求,并且可附加map參數(shù)類型,所以廢棄了apache httpclient封裝  回復(fù)  更多評論
            
          # re: HTML Parser 替代品 jsoup
          2013-08-15 14:59 | jun
          @老妖
          表單數(shù)據(jù)怎么設(shè)置  回復(fù)  更多評論
            
          # HTML Parser 替代品 jsoup
          2013-08-16 15:21 | 合肥期貨開戶
          jquery選擇器語法是什么東東,下下來看看好不好用先。  回復(fù)  更多評論
            
          # re: HTML Parser 替代品 jsoup[未登錄]
          2013-08-17 15:27 | 老妖
          @ jun
          表單的數(shù)據(jù)就是我代碼中寫的map數(shù)據(jù)。你注意看看我的文章中含的外鏈。看文章不仔細(xì)  回復(fù)  更多評論
            

          <2013年8月>
          28293031123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          隨筆分類(48)

          隨筆檔案(104)

          好友鏈接

          我的豆瓣

          積分與排名

          • 積分 - 221059
          • 排名 - 257

          最新評論

          閱讀排行榜

          主站蜘蛛池模板: 葫芦岛市| 昌黎县| 天台县| 阿拉善盟| 太白县| 陈巴尔虎旗| 扶沟县| 龙川县| 新和县| 栾城县| 垣曲县| 昭通市| 西华县| 海宁市| 新竹县| 青海省| 灵川县| 六安市| 镇宁| 丰城市| 曲周县| 金寨县| 安顺市| 青冈县| 佛坪县| 厦门市| 万源市| 玉门市| 彭泽县| 黄冈市| 广东省| 富源县| 普宁市| 城口县| 宽城| 东源县| 西华县| 杭锦后旗| 赣榆县| 白山市| 闵行区|