老妖的博客
          現實的中沒有幾個人能夠真為對方去死,甚至山盟海誓很快就會在金錢面前變的微不足道,這才是生活。沒有永遠的愛,除了你的父母對你,當然也就沒有永遠的恨,更沒有永遠的痛,時間是最好的治療大師,它會很快撫平你心靈上累累的傷痕。很多年以后你想起來時,那些在你生命中洶涌來往的人群至多是個模糊的影子或者毫無意義的名字
          posts - 105,  comments - 171,  trackbacks - 0
          很久以前寫過一篇文章利用htmlparser抓取網頁內容(一),很多人都提問他的詳細使用,其實我也只是入門嘗試,如果想深入使用,還是建議看官方文檔或者測試用例。不過最近剛好有個朋友想再次解析第三方網頁內容,來查看交通違章信息。無意中發現一個比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持類jquery語法,對,你沒看錯,是jquery選擇器語法。下載地址:http://jsoup.org/
          詳細使用文檔,這個地址應該說的很清楚了:http://baike.baidu.com/view/4066913.htm
          使用非常簡單,示例如下(是讀取山西交通違章信息):
           1 import java.util.HashMap;
           2 import java.util.Map;
           3 
           4 import org.jsoup.Jsoup;
           5 import org.jsoup.nodes.Document;
           6 import org.jsoup.select.Elements;
           7 /**
           8  * 
           9  * @author Rocky
          10  *
          11  */
          12 public class spider {
          13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
          14     private void spiderData() throws Exception{
          15          Map<String,String> req=new HashMap<String,String>();
          16          req.put("authCode", "");
          17          req.put("csjcKey","110000");
          18          req.put("hpzl", "02");
          19          req.put("vioViolation.hphm", "xxx");//您的車牌號
          20          req.put("type","1");
          21          req.put("pagination.currentPage", "1");
          22          req.put("pagination.pageSize", "5");
          23          
          24          Document doc=Jsoup.connect(POSTURL).data(req).get();
          25          Elements newsHeadlines=doc.select(".if_tr td");
          26          System.out.println(newsHeadlines.text());
          27     }
          28     /**
          29      * @param args
          30      * @throws Exception 
          31      */
          32     public static void main(String[] args) throws Exception {
          33         
          34         spider spider=new spider();
          35         spider.spiderData();
          36     }
          37 
          38 }
          posted on 2013-08-07 13:25 老妖 閱讀(5899) 評論(4)  編輯  收藏 所屬分類: java心得

          FeedBack:
          # re: HTML Parser 替代品 jsoup
          2013-08-07 13:32 | 老妖
          修正了一下,發現jsoup可以使用connect直接發起http請求,并且可附加map參數類型,所以廢棄了apache httpclient封裝  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup
          2013-08-15 14:59 | jun
          @老妖
          表單數據怎么設置  回復  更多評論
            
          # HTML Parser 替代品 jsoup
          2013-08-16 15:21 | 合肥期貨開戶
          jquery選擇器語法是什么東東,下下來看看好不好用先。  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup[未登錄]
          2013-08-17 15:27 | 老妖
          @ jun
          表單的數據就是我代碼中寫的map數據。你注意看看我的文章中含的外鏈。看文章不仔細  回復  更多評論
            

          <2013年8月>
          28293031123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          隨筆分類(48)

          隨筆檔案(104)

          好友鏈接

          我的豆瓣

          積分與排名

          • 積分 - 221059
          • 排名 - 257

          最新評論

          閱讀排行榜

          主站蜘蛛池模板: 青龙| 南雄市| 北京市| 陆丰市| 铜陵市| 深泽县| 唐海县| 乌兰浩特市| 大关县| 观塘区| 都兰县| 海原县| 冷水江市| 陆良县| 襄城县| 龙岩市| 泰来县| 汉阴县| 万州区| 德兴市| 吉林省| 名山县| 密山市| 文昌市| 宣汉县| 襄垣县| 高州市| 疏勒县| 杭锦旗| 四会市| 云南省| 北京市| 永吉县| 朝阳市| 南昌县| 涟水县| 辽源市| 南皮县| 格尔木市| 岳池县| 富顺县|