老妖的博客
          現實的中沒有幾個人能夠真為對方去死,甚至山盟海誓很快就會在金錢面前變的微不足道,這才是生活。沒有永遠的愛,除了你的父母對你,當然也就沒有永遠的恨,更沒有永遠的痛,時間是最好的治療大師,它會很快撫平你心靈上累累的傷痕。很多年以后你想起來時,那些在你生命中洶涌來往的人群至多是個模糊的影子或者毫無意義的名字
          posts - 105,  comments - 171,  trackbacks - 0
          很久以前寫過一篇文章利用htmlparser抓取網頁內容(一),很多人都提問他的詳細使用,其實我也只是入門嘗試,如果想深入使用,還是建議看官方文檔或者測試用例。不過最近剛好有個朋友想再次解析第三方網頁內容,來查看交通違章信息。無意中發現一個比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持類jquery語法,對,你沒看錯,是jquery選擇器語法。下載地址:http://jsoup.org/
          詳細使用文檔,這個地址應該說的很清楚了:http://baike.baidu.com/view/4066913.htm
          使用非常簡單,示例如下(是讀取山西交通違章信息):
           1 import java.util.HashMap;
           2 import java.util.Map;
           3 
           4 import org.jsoup.Jsoup;
           5 import org.jsoup.nodes.Document;
           6 import org.jsoup.select.Elements;
           7 /**
           8  * 
           9  * @author Rocky
          10  *
          11  */
          12 public class spider {
          13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
          14     private void spiderData() throws Exception{
          15          Map<String,String> req=new HashMap<String,String>();
          16          req.put("authCode", "");
          17          req.put("csjcKey","110000");
          18          req.put("hpzl", "02");
          19          req.put("vioViolation.hphm", "xxx");//您的車牌號
          20          req.put("type","1");
          21          req.put("pagination.currentPage", "1");
          22          req.put("pagination.pageSize", "5");
          23          
          24          Document doc=Jsoup.connect(POSTURL).data(req).get();
          25          Elements newsHeadlines=doc.select(".if_tr td");
          26          System.out.println(newsHeadlines.text());
          27     }
          28     /**
          29      * @param args
          30      * @throws Exception 
          31      */
          32     public static void main(String[] args) throws Exception {
          33         
          34         spider spider=new spider();
          35         spider.spiderData();
          36     }
          37 
          38 }
          posted on 2013-08-07 13:25 老妖 閱讀(5898) 評論(4)  編輯  收藏 所屬分類: java心得

          FeedBack:
          # re: HTML Parser 替代品 jsoup
          2013-08-07 13:32 | 老妖
          修正了一下,發現jsoup可以使用connect直接發起http請求,并且可附加map參數類型,所以廢棄了apache httpclient封裝  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup
          2013-08-15 14:59 | jun
          @老妖
          表單數據怎么設置  回復  更多評論
            
          # HTML Parser 替代品 jsoup
          2013-08-16 15:21 | 合肥期貨開戶
          jquery選擇器語法是什么東東,下下來看看好不好用先。  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup[未登錄]
          2013-08-17 15:27 | 老妖
          @ jun
          表單的數據就是我代碼中寫的map數據。你注意看看我的文章中含的外鏈。看文章不仔細  回復  更多評論
            

          <2025年5月>
          27282930123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          隨筆分類(48)

          隨筆檔案(104)

          好友鏈接

          我的豆瓣

          積分與排名

          • 積分 - 221039
          • 排名 - 257

          最新評論

          閱讀排行榜

          主站蜘蛛池模板: 洪湖市| 赤壁市| 蓝田县| 醴陵市| 新巴尔虎右旗| 石林| 武威市| 榆中县| 隆昌县| 古田县| 柘荣县| 海门市| 固安县| 延长县| 上杭县| 阿勒泰市| 开封县| 宁夏| 江华| 安阳市| 尉犁县| 虞城县| 宽城| 彰武县| 渑池县| 阿拉善左旗| 小金县| 江口县| 吴旗县| 祁连县| 屏边| 大名县| 秦皇岛市| 满洲里市| 衡阳市| 宜丰县| 延津县| 泰兴市| 出国| 镇康县| 南宁市|