Java快速開發平臺

          www.fastunit.com

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            23 Posts :: 0 Stories :: 273 Comments :: 0 Trackbacks

          import java.io.BufferedReader;
          import java.io.InputStreamReader;
          import java.net.HttpURLConnection;
          import java.net.URL;

          public class URLUtil {

            
          public static String getHtml(String urlString) {
              
          try {
                StringBuffer html 
          = new StringBuffer();
                URL url 
          = new URL(urlString);
                HttpURLConnection conn 
          = (HttpURLConnection) url.openConnection();
                InputStreamReader isr 
          = new InputStreamReader(conn.getInputStream());
                BufferedReader br 
          = new BufferedReader(isr);
                String temp;
                
          while ((temp = br.readLine()) != null) {
                  html.append(temp).append(
          "\n");
                }
                br.close();
                isr.close();
                
          return html.toString();
              } 
          catch (Exception e) {
                e.printStackTrace();
                
          return null;
              }
            }

            
          public static void main(String[] args) {
              System.out.println(URLUtil.getHtml(
          "http://www.fastunit.com"));
            }
          }
          posted on 2008-03-26 12:22 FastUnit 閱讀(8738) 評論(7)  編輯  收藏 所屬分類: Java

          Feedback

          # 頂死你 2008-03-26 16:23 草包書生
          還是不錯,用sorckt類實現起來效果更好。
          不過用URL也不錯嘛。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-26 17:52 隔葉黃鶯
          用 HttpURLConnection 比直接用 Socket 肯定要簡單多了,Socket 的話要按照 Http 協議來發送請求。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-27 10:06 hejianhuacn
          使用wget的java實現會更好  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-27 21:52 leson
          URL src = new URL( "http://www.yahoo.com" );
          File dest = new File( "times.html" );
          FileUtils.copyURLToFile( src, dest );

          Apache Commons里面封裝成這樣了。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-28 14:06 勉勉強強
          @leson

          確實是Apache Commons的包裝用得最簡便,呵呵  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼[未登錄] 2012-03-07 18:19 zt
          不知道樓主有沒有遇到過抓取到的html不完整的情況。我用類似上面的代碼抓網頁時有時會遇到得到的html不完整  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼[未登錄] 2012-09-09 02:01 L
          IOUtils.toString(URL u,Charsets encoding)  回復  更多評論
            

          主站蜘蛛池模板: 馆陶县| 宁武县| 舒兰市| 昆明市| 钦州市| 宁乡县| 东阳市| 九龙坡区| 科技| 东辽县| 乌拉特前旗| 神木县| 景洪市| 中山市| 罗定市| 江安县| 嘉祥县| 芮城县| 彰化县| 高平市| 尼勒克县| 涪陵区| 阜宁县| 芮城县| 城口县| 安泽县| 吴川市| 务川| 淮南市| 八宿县| 鄂伦春自治旗| 宁武县| 临安市| 筠连县| 兴海县| 青浦区| 文成县| 大田县| 逊克县| 湘乡市| 大邑县|