隨筆 - 312, 文章 - 14, 評論 - 1393, 引用 - 0
          數據加載中……

          Java正則表達式初學者指南

          本文為原創,如需轉載,請注明作者和出處,謝謝!

             本文將介紹如何在Java中使用正則表達式來處理文本數據。正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象,如下面的幾個字符串:
           
          a98b   c0912d   c10b   a12345678d   ab
           
              我們仔細分析上面五個字符串,可以看出它們有一個共同特征,就是第一個字符必須是'a'或'c',最后一個字符必須是'b'或'd',而中間的字符是任意多個數字組成(包括0個數字)。因此,我們可以將這五個字符串的共同特點抽象出來,這就產生了一個正則表達式:[ac]\\d*[bd]。而根據這個正則表達式,我們可以寫出無窮多個滿足條件的字符串。
           
          在Java中使用正則表達式的方法非常多,最簡單的就是和字符串一起使用。在String中有四個方法可以使用正則表達式,它們是matches、split、replaceAll和replaceFirst。
           
          一、matches方法
           
          matches方法可以判斷當前的字符串是否匹配給定的正則表達式。如果匹配,返回true,否則,返回false。matches方法的定義如下:

          public boolean matches(String regex)
            
            如上面給出的正則表達式我們可以用如下程序驗證。
           
          String[] ss = new String[]{"a98b""c0912d",  "c10b",  "a12345678d",  "ab"};
          for(String s: ss)
              System.out.println(s.matches(
          "[ac]\\d*[bd]"));

          輸出結果:
           
          true
          true
          true
          true
          true
           
             下面簡單解釋一下這個正則表達式的含義。如果我們學過編譯原理的詞法分析,就會很容易理解上面的正則表達式(因為正則表達式的表示方法和詞法分析中的表達式類似)。如在 [...]中的相當于或"|",如[abcd]相當于a|b|c|d,也就是a或b或c或d。如上面的正則表達式的開頭部分是[ac],就代表著字符串的開頭只能是a或c。[bd]表達字符串結尾只能是b或d。而中間的\d表達0-9的數字,由于\在正則表達式中有特殊含義,所以用\\來表示\。而*表示有0或無窮多個(這在詞法分析中叫*閉包),由于*跟在\d后面,因此表達有0或無窮多個數字。
           
          二、split方法
           
          split方法使用正則表達式來分割字符串,并以String數組的形式返回分割結果。split有兩種重載形式,它們定義如下:
           
          public String[] split(String regex)
          public String[] split(String regex, int limit)

              如下面的代碼將使用split的第一種重載形式來分割HTTP請求頭的第一行,代碼如下:
           
          String s = "GET /index.html HTTP/1.1";
          String ss[] 
          = s.split(" +");
          for(String str: ss)
          System.out.println(str);

          輸出結果:
          GET
          /index.html
          HTTP/1.1
           
              在使用split的第一種重載形式時應注意,如果分割后的字符串最后有空串,將被忽略。如使用正則表達式\d來分割字符串a0b1c3456時,得到的數組的長度為3,而不是7。
          在split的第二種重載形式中有一個limit參數,要分三種情況討論:
           
          1. 大于0: 如limit的值為n,那么將對正則表達式使用n-1次,下面的代碼:

          String s = "a0b1c3456";
          String ss[] 
          = s.split("\\d"3);
          for(String str: ss)
              System.out.println(str);


          輸出結果:
           
          a
          b
          c3456
           
          從輸出結果可以看出,程序只對" a0b1c3456"使用了兩次正則表達式,也就是在少掃描完字符'1'后,不管后面有沒有滿足條件的字符串,都將后面的字符串作為一個整體來作為返回數組的最后一個值。
           
          2. 小于0: 不忽略結尾的空串。也就是上面的例子返回數組的長度應該是7,而不是3。
          3. 等于0:這是默認值,相當于split的第一種重載形式。
           
           
          三、replaceAll 和 replaceFirst方法
           
          為兩個方法的定義如下:
          public String replaceAll(String regex, String replacement)
          public String replaceFirst(String regex, String replacement)
           
              這兩個方法用replacement替換當前字符串中和regex匹配的字符串。使用方法很簡單,這里不再詳述,感興趣的讀者可以參考相關的文檔。
           
          對于Java中正則表達式的詳細內容,請參考JDK文檔。




          Android開發完全講義(第2版)(本書版權已輸出到臺灣)

          http://product.dangdang.com/product.aspx?product_id=22741502



          Android高薪之路:Android程序員面試寶典 http://book.360buy.com/10970314.html


          新浪微博:http://t.sina.com.cn/androidguy   昵稱:李寧_Lining

          posted on 2008-05-10 09:14 銀河使者 閱讀(14267) 評論(8)  編輯  收藏 所屬分類: java 原創

          評論

          # re: Java正則表達式初學者指南[未登錄]  回復  更多評論   

          寫的不錯,比某些大學教授出的書強多了
          2008-11-01 22:12 |

          # re: Java正則表達式初學者指南  回復  更多評論   

          非常好!!!
          2008-12-02 19:57 | zhaixf

          # re: Java正則表達式初學者指南  回復  更多評論   

          兄弟,我頂你!剛剛的!
          2008-12-09 21:18 | Sucre

          # re: Java正則表達式初學者指南  回復  更多評論   

          初學者肯定看不懂
          2008-12-15 14:26 | 12

          # re: Java正則表達式初學者指南  回復  更多評論   

          我覺得你寫的好!
          結合一個實例。學習操作一起實現。表復雜的東西簡單化。
          初學者多動一下腦筋,理解應該是沒有問題的。
          2009-01-14 13:40 | 陳綱

          # re: Java正則表達式初學者指南  回復  更多評論   

          沒錯,看任何文章或書,如果一點都不思考,基本上是看不明白的,除非這些已經明白了!!
          2009-01-14 13:54 | 銀河使者

          # re: Java正則表達式初學者指南  回復  更多評論   

          寫的真的不錯!
          2009-02-04 22:14 | 陽陽

          # re: Java正則表達式初學者指南  回復  更多評論   

          很好 講的很清楚 簡潔易懂
          2009-02-18 15:33 | 而且而且
          主站蜘蛛池模板: 金寨县| 许昌市| 鹿邑县| 延吉市| 留坝县| 台北县| 沈阳市| 澎湖县| 民丰县| 合川市| 玉门市| 张掖市| 界首市| 四会市| 永定县| 保靖县| 城口县| 大渡口区| 元朗区| 囊谦县| 体育| 子洲县| 景泰县| 郁南县| 怀化市| 绥芬河市| 铁岭市| 喀喇沁旗| 稷山县| 永胜县| 明溪县| 铁岭县| 治多县| 夏邑县| 尖扎县| 海安县| 三门峡市| 芦山县| 专栏| 临猗县| 尤溪县|