隨筆 - 23  文章 - 15  trackbacks - 0
          <2007年10月>
          30123456
          78910111213
          14151617181920
          21222324252627
          28293031123
          45678910



          留言簿(3)

          隨筆分類(19)

          搜索

          •  

          最新隨筆

          最新評論

          閱讀排行榜

          評論排行榜

          常用正則表達式

            正則表達式用于字符串處理、表單驗證等場合,實用高效。現將一些常用的表達式收集于此,以備不時之需。

          匹配中文字符的正則表達式: [\u4e00-\u9fa5]
          評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了

          匹配雙字節字符(包括漢字在內):[^\x00-\xff]
          評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)

          匹配空白行的正則表達式:\n\s*\r
          評注:可以用來刪除空白行

          匹配HTML標記的正則表達式:<(\S*?)[^>]*>.*?</\1>|<.*? />
          評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力

          匹配首尾空白字符的正則表達式:^\s*|\s*$
          評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式

          匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
          評注:表單驗證時很實用

          匹配網址URL的正則表達式:[a-zA-z]+://[^\s]*
          評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求

          匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
          評注:表單驗證時很實用

          匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}
          評注:匹配形式如 0511-4405222 或 021-87888822

          匹配騰訊QQ號:[1-9][0-9]{4,}
          評注:騰訊QQ號從10000開始

          匹配中國郵政編碼:[1-9]\d{5}(?!\d)
          評注:中國郵政編碼為6位數字

          匹配身份證:\d{15}|\d{18}
          評注:中國的身份證為15位或18位

          匹配ip地址:\d+\.\d+\.\d+\.\d+
          評注:提取ip地址時有用

          匹配特定數字:
          ^[1-9]\d*$    //匹配正整數
          ^-[1-9]\d*$   //匹配負整數
          ^-?[1-9]\d*$   //匹配整數
          ^[1-9]\d*|0$  //匹配非負整數(正整數 + 0)
          ^-[1-9]\d*|0$   //匹配非正整數(負整數 + 0)
          ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮點數
          ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配負浮點數
          ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮點數
          ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非負浮點數(正浮點數 + 0)
          ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮點數(負浮點數 + 0)
          評注:處理大量數據時有用,具體應用時注意修正

          匹配特定字符串:
          ^[A-Za-z]+$  //匹配由26個英文字母組成的字符串
          ^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串
          ^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串
          ^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串
          ^\w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串
          評注:最基本也是最常用的一些表達式

          posted on 2007-10-17 09:57 jiadong 閱讀(761) 評論(1)  編輯  收藏 所屬分類: OTHERS

          FeedBack:
          # re: 常用正則表達 2007-10-17 10:19 jiadong
          "^\d+$"  //非負整數(正整數 + 0)
          "^\[0-9\]*\[1-9\]\[0-9\]*$"  //正整數
          "^((-\d+)\|(0+))$"  //非正整數(負整數 + 0)
          "^-\[0-9\]*\[1-9\]\[0-9\]*$"  //負整數
          "^-?\d+$"    //整數
          "^\d+(\.\d+)?$"  //非負浮點數(正浮點數 + 0)
          "^((\[0-9\]+\.\[0-9\]*\[1-9\]\[0-9\]*)\|(\[0-9\]*\[1-9\]\[0-9\]*\.\[0-9\]+)\|(\[0-9\]*\[1-9\]\[0-9\]*))$"  //正浮點數
          "^((-\d+(\.\d+)?)\|(0+(\.0+)?))$"  //非正浮點數(負浮點數 + 0)
          "^(-((\[0-9\]+\.\[0-9\]*\[1-9\]\[0-9\]*)\|(\[0-9\]*\[1-9\]\[0-9\]*\.\[0-9\]+)\|(\[0-9\]*\[1-9\]\[0-9\]*)))$"  //負浮點數
          "^(-?\d+)(\.\d+)?$"  //浮點數
          "^\[A-Za-z\]+$"  //由26個英文字母組成的字符串
          "^\[A-Z\]+$"  //由26個英文字母的大寫組成的字符串
          "^\[a-z\]+$"  //由26個英文字母的小寫組成的字符串
          "^\[A-Za-z0-9\]+$"  //由數字和26個英文字母組成的字符串
          "^\w+$"  //由數字、26個英文字母或者下劃線組成的字符串
          "^\[\w-\]+(\.\[\w-\]+)*@\[\w-\]+(\.\[\w-\]+)+$"    //email地址
          "^\[a-zA-z\]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"  //url
          /^(d{2}\|d{4})-((0(\[1-9\]{1}))\|(1\[1\|2\]))-((\[0-2\](\[1-9\]{1}))\|(3\[0\|1\]))$/&nbsp;&nbsp; //&nbsp; 年-月-日
          /^((0(\[1-9\]{1}))\|(1\[1\|2\]))/((\[0-2\](\[1-9\]{1}))\|(3\[0\|1\]))/(d{2}\|d{4})$/&nbsp;&nbsp; // 月/日/年
          "^(\[w-.\]+)@((\[\[0-9\]{1,3}.\[0-9\]{1,3}.\[0-9\]{1,3}.)\|((\[w-\]+.)+))(\[a-zA-Z\]{2,4}\|\[0-9\]{1,3})(\]?)$"&nbsp;&nbsp; //Emil
          "(d+-)?(d{4}-?d{7}\|d{3}-?d{8}\|^d{7,8})(-d+)?" //電話號碼
          "^(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\])$"&nbsp;&nbsp; //IP地址

          匹配中文字符的正則表達式: \[\u4e00-\u9fa5\]
          匹配雙字節字符(包括漢字在內):\[^\x00-\xff\]
          匹配空行的正則表達式:\n\[\s\| \]*\r
          匹配HTML標記的正則表達式:/<(.*)>.*<\/\1>\|<(.*) \/>/
          匹配首尾空格的正則表達式:(^\s*)\|(\s*$)
          匹配Email地址的正則表達式:\w+(\[-+.\]\w+)*@\w+(\[-.\]\w+)*\.\w+(\[-.\]\w+)\*
          匹配網址URL的正則表達式:^\[a-zA-z\]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$
          匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^\[a-zA-Z\]\[a-zA-Z0-9_\]{4,15}$
          匹配國內電話號碼:(\d{3}-\|\d{4}-)?(\d{8}\|\d{7})?
          匹配騰訊QQ號:^\[1-9\]*\[1-9\]\[0-9\]*$


          元字符及其在正則表達式上下文中的行為
          \ 將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。
          ^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的Multiline 屬性,\^ 也匹配 '\n' 或 '\r' 之后的位置。
          $ 匹配輸入字符串的結束位置。如果設置了 RegExp 對象的Multiline 屬性,$ 也匹配 '\n' 或 '\r' 之前的位置。
          \* 匹配前面的子表達式零次或多次。
          + 匹配前面的子表達式一次或多次。\+ 等價于 {1,}。
          ? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。

          {n} n 是一個非負整數,匹配確定的n 次。
          {n,} n 是一個非負整數,至少匹配n 次。
          {n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

          ? 當該字符緊跟在任何一個其他限制符 (*, \+, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。
          . 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用象 '\[.\n\]' 的模式。

          (pattern) 匹配pattern 并獲取這一匹配。
          (?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。
          (?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。
          (?\!pattern) 負向預查,與(?=pattern)作用相反

          x\|y 匹配 x 或 y。
          \[xyz\] 字符集合。
          \[^xyz\] 負值字符集合。
          \[a-z\] 字符范圍,匹配指定范圍內的任意字符。
          \[^a-z\] 負值字符范圍,匹配任何不在指定范圍內的任意字符。

          \b 匹配一個單詞邊界,也就是指單詞和空格間的位置。
          \B 匹配非單詞邊界。
          \cx 匹配由x指明的控制字符。
          \d 匹配一個數字字符。等價于 \[0-9\]。
          \D 匹配一個非數字字符。等價于 \[^0-9\]。
          \f 匹配一個換頁符。等價于 \x0c 和 \cL。
          \n 匹配一個換行符。等價于 \x0a 和 \cJ。
          \r 匹配一個回車符。等價于 \x0d 和 \cM。
          \s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于\[ \f\n\r\t\v\]。
          \S 匹配任何非空白字符。等價于 \[\^ \f\n\r\t\v\]。
          \t 匹配一個制表符。等價于 \x09 和 \cI。
          \v 匹配一個垂直制表符。等價于 \x0b 和 \cK。
          \w 匹配包括下劃線的任何單詞字符。等價于'\[A-Za-z0-9_\]'。
          \W 匹配任何非單詞字符。等價于 '\[^A-Za-z0-9_\]'。

          \xn 匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。
          \num 匹配 num,其中num是一個正整數。對所獲取的匹配的引用。
          \n 標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進制數字 (0-7),則 n 為一個八進制轉義值。
          \nm 標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 \nm 將匹配八進制轉義值 nm。
          \nml 如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值 nml。
          \un 匹配 n,其中 n 是一個用四個十六進制數字表示的Unicode字符。

          匹配中文字符的正則表達式: \[u4e00-u9fa5\]
          匹配雙字節字符(包括漢字在內):\[^x00-xff\]
          匹配空行的正則表達式:n\[s\| \]*r
          匹配HTML標記的正則表達式:/<(.*)>.*</1>\|<(.*) />/
          匹配首尾空格的正則表達式:(^s*)\|(s*$)
          匹配Email地址的正則表達式:w+(\[-+.\]w+)*@w+(\[-.\]w+)*.w+(\[-.\]w+)\*
          匹配網址URL的正則表達式:http://(\[w-\]+.)+\[w-\]+(/\[w\- ./?%&=\]*)?


          利用正則表達式限制網頁表單里的文本框輸入內容
          1、用正則表達式限制只能輸入中文:onkeyup="value="/value.replace(/\["^u4E00-u9FA5\]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^u4E00-u9FA5\]/g,''))"

          2、用正則表達式限制只能輸入全角字符: onkeyup="value="/value.replace(/\["^uFF00-uFFFF\]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^uFF00-uFFFF\]/g,''))"

          3、用正則表達式限制只能輸入數字:onkeyup="value="/value.replace(/\["^d\]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^d\]/g,''))"

          4、用正則表達式限制只能輸入數字和英文:onkeyup="value="/value.replace(/\[W\]/g,"'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace

            回復  更多評論
            
          主站蜘蛛池模板: 吴堡县| 湖口县| 尼木县| 富平县| 洪泽县| 庆城县| 青浦区| 万年县| 晋宁县| 九寨沟县| 收藏| 新平| 阿拉善盟| 镇江市| 将乐县| 额尔古纳市| 翁牛特旗| 邳州市| 隆德县| 兴义市| 缙云县| 大港区| 高要市| 抚远县| 松阳县| 东乡族自治县| 长乐市| 侯马市| 开江县| 集贤县| 敦煌市| 盐城市| 志丹县| 朝阳区| 江西省| 兴文县| 麟游县| 石家庄市| 云安县| 黔江区| 边坝县|