Java快速開(kāi)發(fā)平臺(tái)

          www.fastunit.com

            BlogJava :: 首頁(yè) :: 聯(lián)系 :: 聚合  :: 管理
            23 Posts :: 0 Stories :: 273 Comments :: 0 Trackbacks

          import java.io.BufferedReader;
          import java.io.InputStreamReader;
          import java.net.HttpURLConnection;
          import java.net.URL;

          public class URLUtil {

            
          public static String getHtml(String urlString) {
              
          try {
                StringBuffer html 
          = new StringBuffer();
                URL url 
          = new URL(urlString);
                HttpURLConnection conn 
          = (HttpURLConnection) url.openConnection();
                InputStreamReader isr 
          = new InputStreamReader(conn.getInputStream());
                BufferedReader br 
          = new BufferedReader(isr);
                String temp;
                
          while ((temp = br.readLine()) != null) {
                  html.append(temp).append(
          "\n");
                }
                br.close();
                isr.close();
                
          return html.toString();
              } 
          catch (Exception e) {
                e.printStackTrace();
                
          return null;
              }
            }

            
          public static void main(String[] args) {
              System.out.println(URLUtil.getHtml(
          "http://www.fastunit.com"));
            }
          }
          posted on 2008-03-26 12:22 FastUnit 閱讀(8739) 評(píng)論(7)  編輯  收藏 所屬分類: Java

          Feedback

          # 頂死你 2008-03-26 16:23 草包書(shū)生
          還是不錯(cuò),用sorckt類實(shí)現(xiàn)起來(lái)效果更好。
          不過(guò)用URL也不錯(cuò)嘛。  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼 2008-03-26 17:52 隔葉黃鶯
          用 HttpURLConnection 比直接用 Socket 肯定要簡(jiǎn)單多了,Socket 的話要按照 Http 協(xié)議來(lái)發(fā)送請(qǐng)求。  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼 2008-03-27 10:06 hejianhuacn
          使用wget的java實(shí)現(xiàn)會(huì)更好  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼 2008-03-27 21:52 leson
          URL src = new URL( "http://www.yahoo.com" );
          File dest = new File( "times.html" );
          FileUtils.copyURLToFile( src, dest );

          Apache Commons里面封裝成這樣了。  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼 2008-03-28 14:06 勉勉強(qiáng)強(qiáng)
          @leson

          確實(shí)是Apache Commons的包裝用得最簡(jiǎn)便,呵呵  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼[未登錄](méi) 2012-03-07 18:19 zt
          不知道樓主有沒(méi)有遇到過(guò)抓取到的html不完整的情況。我用類似上面的代碼抓網(wǎng)頁(yè)時(shí)有時(shí)會(huì)遇到得到的html不完整  回復(fù)  更多評(píng)論
            

          # re: 通過(guò)url地址抓取網(wǎng)頁(yè)html代碼[未登錄](méi) 2012-09-09 02:01 L
          IOUtils.toString(URL u,Charsets encoding)  回復(fù)  更多評(píng)論
            

          主站蜘蛛池模板: 荃湾区| 民县| 汉中市| 搜索| 顺昌县| 乐山市| 邵武市| 青海省| 岳池县| 雷波县| 尼玛县| 德昌县| 南溪县| 虞城县| 民乐县| 河间市| 商洛市| 榕江县| 恩平市| 湖口县| 承德县| 乃东县| 九江县| 特克斯县| 廊坊市| 若尔盖县| 宣恩县| 巨野县| 定边县| 兰西县| 崇左市| 卓资县| 东平县| 永顺县| 呈贡县| 岗巴县| 德昌县| 重庆市| 泾源县| 泽库县| 南岸区|