隨筆-6  評論-3  文章-0  trackbacks-0

          /**
          ?? *
          ?? * 解析文件,取出URL地址
          ?? *
          ?? */
          ?public static void regexStr(){
          ??String input="飛機但是??Pattern p = Pattern.compile("http://[*[a-zA-Z]|w{3}].*[a-zA-Z]");
          ??Matcher m = p.matcher(input);
          ??m.find();
          ??String str=m.group();
          ??????? System.out.print(str);
          ??
          ??
          ?}
          /**
          ?* 根據URL,把網頁保存到本地
          ?* @param urlStr
          ?* @param filename
          ?* @return
          ?*/?
          ?public? static? boolean? getUrlToFileInputStream(String urlStr, String filename){
          ? ?
          ? ?DataInputStream dataInputStream=null;
          ? ?try{
          ? ??? URL url = new URL(urlStr);
          ?????????? URLConnection conn = url.openConnection();
          ?????????? dataInputStream = new DataInputStream(conn.getInputStream());
          ??????????
          ???? }catch(Exception e){
          ???? ?e.getMessage();
          ???
          ???? }
          ???? DataOutputStream dataoutputstream = null;
          ? ?if(dataInputStream !=null){
          ??? ???? try {
          ????dataoutputstream = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(filename)));
          ???
          ???byte b[] = new byte[1024*10];
          ???int len = 0;
          ???while ((len = dataInputStream.read(b, 0, 1024)) != -1) {
          ????dataoutputstream.write(b, 0, len);
          ???}

          ???dataoutputstream.flush();
          ??? ???? } catch (Exception e) {
          ????// TODO Auto-generated catch block
          ????e.printStackTrace();
          ???}
          ??????????? return true;
          ? ?}else{
          ? ??return false;
          ? ?}
          ????
          ????
          ? }

          posted on 2006-10-31 15:06 野風 閱讀(1269) 評論(1)  編輯  收藏

          評論:
          # re: 簡單的解析文件,取URL地址,并根據地址抓下頁面 2006-10-31 21:57 | stoneshao[匿名]
          抓取網頁比較容易,重點應該放在對頁面的解析上  回復  更多評論
            

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 安顺市| 广灵县| 资中县| 永康市| 阿荣旗| 广安市| 古交市| 图们市| 前郭尔| 静乐县| 鸡东县| 正蓝旗| 收藏| 拜泉县| 锦州市| 盐山县| 富川| 四川省| 保康县| 荣成市| 行唐县| 青海省| 丘北县| 湖州市| 林芝县| 樟树市| 洛扎县| 化州市| 苏尼特右旗| 房产| 吉首市| 泾阳县| 榆社县| 莲花县| 阆中市| 名山县| 民勤县| 绥芬河市| 儋州市| 高陵县| 柞水县|