隨筆-6  評論-3  文章-0  trackbacks-0

          /**
          ?? *
          ?? * 解析文件,取出URL地址
          ?? *
          ?? */
          ?public static void regexStr(){
          ??String input="飛機但是??Pattern p = Pattern.compile("http://[*[a-zA-Z]|w{3}].*[a-zA-Z]");
          ??Matcher m = p.matcher(input);
          ??m.find();
          ??String str=m.group();
          ??????? System.out.print(str);
          ??
          ??
          ?}
          /**
          ?* 根據URL,把網頁保存到本地
          ?* @param urlStr
          ?* @param filename
          ?* @return
          ?*/?
          ?public? static? boolean? getUrlToFileInputStream(String urlStr, String filename){
          ? ?
          ? ?DataInputStream dataInputStream=null;
          ? ?try{
          ? ??? URL url = new URL(urlStr);
          ?????????? URLConnection conn = url.openConnection();
          ?????????? dataInputStream = new DataInputStream(conn.getInputStream());
          ??????????
          ???? }catch(Exception e){
          ???? ?e.getMessage();
          ???
          ???? }
          ???? DataOutputStream dataoutputstream = null;
          ? ?if(dataInputStream !=null){
          ??? ???? try {
          ????dataoutputstream = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(filename)));
          ???
          ???byte b[] = new byte[1024*10];
          ???int len = 0;
          ???while ((len = dataInputStream.read(b, 0, 1024)) != -1) {
          ????dataoutputstream.write(b, 0, len);
          ???}

          ???dataoutputstream.flush();
          ??? ???? } catch (Exception e) {
          ????// TODO Auto-generated catch block
          ????e.printStackTrace();
          ???}
          ??????????? return true;
          ? ?}else{
          ? ??return false;
          ? ?}
          ????
          ????
          ? }

          posted on 2006-10-31 15:06 野風 閱讀(1264) 評論(1)  編輯  收藏

          評論:
          # re: 簡單的解析文件,取URL地址,并根據地址抓下頁面 2006-10-31 21:57 | stoneshao[匿名]
          抓取網頁比較容易,重點應該放在對頁面的解析上  回復  更多評論
            

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 香河县| 昭觉县| 长春市| 桐城市| 洪雅县| 玛曲县| 铁力市| 即墨市| 怀远县| 修武县| 澄迈县| 资阳市| 金溪县| 漠河县| 麟游县| 彭州市| 韶山市| 望江县| 麻栗坡县| 中方县| 繁峙县| 射洪县| 涿鹿县| 皋兰县| 友谊县| 古蔺县| 当雄县| 赤峰市| 腾冲县| 安新县| 河北省| 通许县| 武鸣县| 察隅县| 石渠县| 石门县| 南乐县| 响水县| 台州市| 辉南县| 兰坪|