老妖的博客
          現實的中沒有幾個人能夠真為對方去死,甚至山盟海誓很快就會在金錢面前變的微不足道,這才是生活。沒有永遠的愛,除了你的父母對你,當然也就沒有永遠的恨,更沒有永遠的痛,時間是最好的治療大師,它會很快撫平你心靈上累累的傷痕。很多年以后你想起來時,那些在你生命中洶涌來往的人群至多是個模糊的影子或者毫無意義的名字
          posts - 105,  comments - 171,  trackbacks - 0
          很久以前寫過一篇文章利用htmlparser抓取網頁內容(一),很多人都提問他的詳細使用,其實我也只是入門嘗試,如果想深入使用,還是建議看官方文檔或者測試用例。不過最近剛好有個朋友想再次解析第三方網頁內容,來查看交通違章信息。無意中發現一個比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持類jquery語法,對,你沒看錯,是jquery選擇器語法。下載地址:http://jsoup.org/
          詳細使用文檔,這個地址應該說的很清楚了:http://baike.baidu.com/view/4066913.htm
          使用非常簡單,示例如下(是讀取山西交通違章信息):
           1 import java.util.HashMap;
           2 import java.util.Map;
           3 
           4 import org.jsoup.Jsoup;
           5 import org.jsoup.nodes.Document;
           6 import org.jsoup.select.Elements;
           7 /**
           8  * 
           9  * @author Rocky
          10  *
          11  */
          12 public class spider {
          13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
          14     private void spiderData() throws Exception{
          15          Map<String,String> req=new HashMap<String,String>();
          16          req.put("authCode", "");
          17          req.put("csjcKey","110000");
          18          req.put("hpzl", "02");
          19          req.put("vioViolation.hphm", "xxx");//您的車牌號
          20          req.put("type","1");
          21          req.put("pagination.currentPage", "1");
          22          req.put("pagination.pageSize", "5");
          23          
          24          Document doc=Jsoup.connect(POSTURL).data(req).get();
          25          Elements newsHeadlines=doc.select(".if_tr td");
          26          System.out.println(newsHeadlines.text());
          27     }
          28     /**
          29      * @param args
          30      * @throws Exception 
          31      */
          32     public static void main(String[] args) throws Exception {
          33         
          34         spider spider=new spider();
          35         spider.spiderData();
          36     }
          37 
          38 }
          posted on 2013-08-07 13:25 老妖 閱讀(5915) 評論(4)  編輯  收藏 所屬分類: java心得

          FeedBack:
          # re: HTML Parser 替代品 jsoup
          2013-08-07 13:32 | 老妖
          修正了一下,發現jsoup可以使用connect直接發起http請求,并且可附加map參數類型,所以廢棄了apache httpclient封裝  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup
          2013-08-15 14:59 | jun
          @老妖
          表單數據怎么設置  回復  更多評論
            
          # HTML Parser 替代品 jsoup
          2013-08-16 15:21 | 合肥期貨開戶
          jquery選擇器語法是什么東東,下下來看看好不好用先。  回復  更多評論
            
          # re: HTML Parser 替代品 jsoup[未登錄]
          2013-08-17 15:27 | 老妖
          @ jun
          表單的數據就是我代碼中寫的map數據。你注意看看我的文章中含的外鏈??次恼虏蛔屑?nbsp; 回復  更多評論
            

          <2025年7月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          常用鏈接

          隨筆分類(48)

          隨筆檔案(104)

          好友鏈接

          我的豆瓣

          積分與排名

          • 積分 - 221794
          • 排名 - 257

          最新評論

          閱讀排行榜

          主站蜘蛛池模板: 东乌珠穆沁旗| 麟游县| 嘉义市| 延津县| 铜山县| 怀柔区| 会宁县| 潮安县| 临夏县| 永济市| 凤阳县| 公安县| 江口县| 南宫市| 长治市| 台南县| 岫岩| 同德县| 葵青区| 赤水市| 巨野县| 平定县| 奎屯市| 公安县| 徐汇区| 西乌| 确山县| 靖安县| 金秀| 象山县| 革吉县| 肇州县| 堆龙德庆县| 长治市| 双峰县| 巴青县| 平凉市| 博乐市| 军事| 泽州县| 高邮市|