Java快速開發平臺

www.fastunit.com

:: 管理

23 Posts :: 0 Stories :: 273 Comments :: 0 Trackbacks

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;

public class URLUtil {

  public static String getHtml(String urlString) {
    try {
      StringBuffer html = new StringBuffer();
      URL url = new URL(urlString);
      HttpURLConnection conn = (HttpURLConnection) url.openConnection();
      InputStreamReader isr = new InputStreamReader(conn.getInputStream());
      BufferedReader br = new BufferedReader(isr);
      String temp;
      while ((temp = br.readLine()) != null) {
        html.append(temp).append("\n");
      }
      br.close();
      isr.close();
      return html.toString();
    } catch (Exception e) {
      e.printStackTrace();
      return null;
    }
  }

  public static void main(String[] args) {
    System.out.println(URLUtil.getHtml("http://www.fastunit.com"));
  }
}

posted on 2008-03-26 12:22 FastUnit 閱讀(8746) 評論(7) 編輯收藏所屬分類: Java

Feedback

# 頂死你 2008-03-26 16:23 草包書生

還是不錯，用sorckt類實現起來效果更好。
不過用URL也不錯嘛。回復更多評論

# re: 通過url地址抓取網頁html代碼 2008-03-26 17:52 隔葉黃鶯

用 HttpURLConnection 比直接用 Socket 肯定要簡單多了，Socket 的話要按照 Http 協議來發送請求。回復更多評論

# re: 通過url地址抓取網頁html代碼 2008-03-27 10:06 hejianhuacn

使用wget的java實現會更好回復更多評論

# re: 通過url地址抓取網頁html代碼 2008-03-27 21:52 leson

URL src = new URL( "http://www.yahoo.com" );
File dest = new File( "times.html" );
FileUtils.copyURLToFile( src, dest );

Apache Commons里面封裝成這樣了。回復更多評論

# re: 通過url地址抓取網頁html代碼 2008-03-28 14:06 勉勉強強

@leson

確實是Apache Commons的包裝用得最簡便，呵呵回復更多評論

# re: 通過url地址抓取網頁html代碼[未登錄] 2012-03-07 18:19 zt

不知道樓主有沒有遇到過抓取到的html不完整的情況。我用類似上面的代碼抓網頁時有時會遇到得到的html不完整回復更多評論

# re: 通過url地址抓取網頁html代碼[未登錄] 2012-09-09 02:01 L

IOUtils.toString(URL u,Charsets encoding) 回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 招聘（北京）Java開發人員銷售訂單管理 - 主從表開發案例字符串的壓縮和解壓縮文件過濾器FileFilter Comparator和Comparable在排序中的應用通過url地址抓取網頁html代碼金額數字轉中文大寫 Java操作Cookie HTML編輯器FCKeditor使用詳解 Java定時任務的實現

Java快速開發平臺

公告

常用鏈接

留言簿(23)

隨筆分類

隨筆檔案

Links

搜索

最新評論

閱讀排行榜

評論排行榜

Feedback