国产永久av在线,午夜日韩福利,亚洲成人男人天堂

Java抓取網(wǎng)頁內(nèi)容

用Java代碼來抓取網(wǎng)頁內(nèi)容有很多種方法，可以直接用網(wǎng)絡編程的知識鏈接到網(wǎng)站上用輸入輸出流的方式來讀取內(nèi)容，然后用正則表達是來解析流文件，得到自己想要的內(nèi)容。不過有人已經(jīng)將這種內(nèi)容封裝好了叫HTMLParser這個東西提供了很多的的方法可以使用，具體的網(wǎng)上有很多的例子他有三種方式來解析這個網(wǎng)頁。下一節(jié)來說明他們之間的使用方式。

貼一個用URL的方式。這個代碼雖然能出結果，不過好像有問題，還望高人指點！！

package com.xjsx.gethtml;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

public class GetHTML {

    /**
     * @param args
     */
    public static void main(String[] args) {

        try {

            URL url = new URL("http://www.baidu.com");

            URLConnection urlConnection = url.openConnection();

            InputStream inputStream = urlConnection.getInputStream();

            // InputStream inputStream = url.openStream();

            BufferedReader reader = new BufferedReader(new InputStreamReader(
                    inputStream));

            String date;

            while ((date = reader.readLine()) != null) {
                System.out.println(date);
            }

        } catch (MalformedURLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

}

發(fā)表于 2010-12-21 11:48 大道至簡閱讀(2420) 評論(1) 編輯收藏

評論

# re: Java抓取網(wǎng)頁內(nèi)容

java抓取網(wǎng)頁相關demo源代碼下載地址：http://zuidaima.com/share/k%E6%8A%93%E5%8F%96%E7%BD%91%E9%A1%B5-p1-s1.htm

zuidaima 評論于 2014-11-25 15:36 回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理

Java抓取網(wǎng)頁內(nèi)容

導航

統(tǒng)計

常用鏈接

留言簿

隨筆檔案

文章分類

文章檔案

相冊

收藏夾

搜索

最新評論

閱讀排行榜

評論排行榜