Java快速開發平臺

          www.fastunit.com

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            23 Posts :: 0 Stories :: 273 Comments :: 0 Trackbacks

          import java.io.BufferedReader;
          import java.io.InputStreamReader;
          import java.net.HttpURLConnection;
          import java.net.URL;

          public class URLUtil {

            
          public static String getHtml(String urlString) {
              
          try {
                StringBuffer html 
          = new StringBuffer();
                URL url 
          = new URL(urlString);
                HttpURLConnection conn 
          = (HttpURLConnection) url.openConnection();
                InputStreamReader isr 
          = new InputStreamReader(conn.getInputStream());
                BufferedReader br 
          = new BufferedReader(isr);
                String temp;
                
          while ((temp = br.readLine()) != null) {
                  html.append(temp).append(
          "\n");
                }
                br.close();
                isr.close();
                
          return html.toString();
              } 
          catch (Exception e) {
                e.printStackTrace();
                
          return null;
              }
            }

            
          public static void main(String[] args) {
              System.out.println(URLUtil.getHtml(
          "http://www.fastunit.com"));
            }
          }
          posted on 2008-03-26 12:22 FastUnit 閱讀(8739) 評論(7)  編輯  收藏 所屬分類: Java

          Feedback

          # 頂死你 2008-03-26 16:23 草包書生
          還是不錯,用sorckt類實現起來效果更好。
          不過用URL也不錯嘛。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-26 17:52 隔葉黃鶯
          用 HttpURLConnection 比直接用 Socket 肯定要簡單多了,Socket 的話要按照 Http 協議來發送請求。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-27 10:06 hejianhuacn
          使用wget的java實現會更好  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-27 21:52 leson
          URL src = new URL( "http://www.yahoo.com" );
          File dest = new File( "times.html" );
          FileUtils.copyURLToFile( src, dest );

          Apache Commons里面封裝成這樣了。  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼 2008-03-28 14:06 勉勉強強
          @leson

          確實是Apache Commons的包裝用得最簡便,呵呵  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼[未登錄] 2012-03-07 18:19 zt
          不知道樓主有沒有遇到過抓取到的html不完整的情況。我用類似上面的代碼抓網頁時有時會遇到得到的html不完整  回復  更多評論
            

          # re: 通過url地址抓取網頁html代碼[未登錄] 2012-09-09 02:01 L
          IOUtils.toString(URL u,Charsets encoding)  回復  更多評論
            

          主站蜘蛛池模板: 通化市| 松桃| 博客| 岐山县| 手游| 安乡县| 科尔| 文成县| 邛崃市| 浏阳市| 黑河市| 茶陵县| 尉犁县| 乌苏市| 宁波市| 青龙| 彭水| 专栏| 乌鲁木齐县| 卢湾区| 靖远县| 华蓥市| 平阴县| 股票| 吉安市| 云龙县| 桐城市| 郁南县| 霍州市| 祁东县| 体育| 全椒县| 汶川县| 平山县| 明溪县| 铅山县| 三门县| 龙海市| 明光市| 霍林郭勒市| 徐闻县|