jiadd
Java Blog

隨筆 - 23 文章 - 15 trackbacks - 0

2007年10月

>

日

一

二

三

四

五

六

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

留言簿(3)

隨筆分類(19)

搜索

閱讀排行榜

評論排行榜

常用正則表達

常用正則表達式

　　正則表達式用于字符串處理、表單驗證等場合，實用高效。現將一些常用的表達式收集于此，以備不時之需。

匹配中文字符的正則表達式： [\u4e00-\u9fa5]
評注：匹配中文還真是個頭疼的事，有了這個表達式就好辦了

匹配雙字節字符(包括漢字在內)：[^\x00-\xff]
評注：可以用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）

匹配空白行的正則表達式：\n\s*\r
評注：可以用來刪除空白行

匹配HTML標記的正則表達式：<(\S*?)[^>]*>.*?</\1>|<.*? />
評注：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對于復雜的嵌套標記依舊無能為力

匹配首尾空白字符的正則表達式：^\s*|\s*$
評注：可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等)，非常有用的表達式

匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評注：表單驗證時很實用

匹配網址URL的正則表達式：[a-zA-z]+://[^\s]*
評注：網上流傳的版本功能很有限，上面這個基本可以滿足需求

匹配帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注：表單驗證時很實用

匹配國內電話號碼：\d{3}-\d{8}|\d{4}-\d{7}
評注：匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號：[1-9][0-9]{4,}
評注：騰訊QQ號從10000開始

匹配中國郵政編碼：[1-9]\d{5}(?!\d)
評注：中國郵政編碼為6位數字

匹配身份證：\d{15}|\d{18}
評注：中國的身份證為15位或18位

匹配ip地址：\d+\.\d+\.\d+\.\d+
評注：提取ip地址時有用

匹配特定數字：
^[1-9]\d*$　　 //匹配正整數
^-[1-9]\d*$ 　 //匹配負整數
^-?[1-9]\d*$　　 //匹配整數
^[1-9]\d*|0$　 //匹配非負整數（正整數 + 0）
^-[1-9]\d*|0$　　 //匹配非正整數（負整數 + 0）
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$　　 //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$　 //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮點數（負浮點數 + 0）
評注：處理大量數據時有用，具體應用時注意修正

匹配特定字符串：
^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串
^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串
^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串
^\w+$　　//匹配由數字、26個英文字母或者下劃線組成的字符串
評注：最基本也是最常用的一些表達式

posted on 2007-10-17 09:57 jiadong 閱讀(761) 評論(1) 編輯收藏所屬分類: OTHERS

FeedBack:

# re: 常用正則表達 2007-10-17 10:19 jiadong

"^\d+$"　　//非負整數（正整數 + 0）
"^\[0-9\]*\[1-9\]\[0-9\]*$"　　//正整數
"^((-\d+)\|(0+))$"　　//非正整數（負整數 + 0）
"^-\[0-9\]*\[1-9\]\[0-9\]*$"　　//負整數
"^-?\d+$"　　　　//整數
"^\d+(\.\d+)?$"　　//非負浮點數（正浮點數 + 0）
"^((\[0-9\]+\.\[0-9\]*\[1-9\]\[0-9\]*)\|(\[0-9\]*\[1-9\]\[0-9\]*\.\[0-9\]+)\|(\[0-9\]*\[1-9\]\[0-9\]*))$"　　//正浮點數
"^((-\d+(\.\d+)?)\|(0+(\.0+)?))$"　　//非正浮點數（負浮點數 + 0）
"^(-((\[0-9\]+\.\[0-9\]*\[1-9\]\[0-9\]*)\|(\[0-9\]*\[1-9\]\[0-9\]*\.\[0-9\]+)\|(\[0-9\]*\[1-9\]\[0-9\]*)))$"　　//負浮點數
"^(-?\d+)(\.\d+)?$"　　//浮點數
"^\[A-Za-z\]+$"　　//由26個英文字母組成的字符串
"^\[A-Z\]+$"　　//由26個英文字母的大寫組成的字符串
"^\[a-z\]+$"　　//由26個英文字母的小寫組成的字符串
"^\[A-Za-z0-9\]+$"　　//由數字和26個英文字母組成的字符串
"^\w+$"　　//由數字、26個英文字母或者下劃線組成的字符串
"^\[\w-\]+(\.\[\w-\]+)*@\[\w-\]+(\.\[\w-\]+)+$"　　　　//email地址
"^\[a-zA-z\]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"　　//url
/^(d{2}\|d{4})-((0(\[1-9\]{1}))\|(1\[1\|2\]))-((\[0-2\](\[1-9\]{1}))\|(3\[0\|1\]))$/   //  年-月-日
/^((0(\[1-9\]{1}))\|(1\[1\|2\]))/((\[0-2\](\[1-9\]{1}))\|(3\[0\|1\]))/(d{2}\|d{4})$/   // 月/日/年
"^(\[w-.\]+)@((\[\[0-9\]{1,3}.\[0-9\]{1,3}.\[0-9\]{1,3}.)\|((\[w-\]+.)+))(\[a-zA-Z\]{2,4}\|\[0-9\]{1,3})(\]?)$"   //Emil
"(d+-)?(d{4}-?d{7}\|d{3}-?d{8}\|^d{7,8})(-d+)?" //電話號碼
"^(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\]).(d{1,2}\|1dd\|2\[0-4\]d\|25\[0-5\])$"   //IP地址

匹配中文字符的正則表達式： \[\u4e00-\u9fa5\]
匹配雙字節字符(包括漢字在內)：\[^\x00-\xff\]
匹配空行的正則表達式：\n\[\s\| \]*\r
匹配HTML標記的正則表達式：/<(.*)>.*<\/\1>\|<(.*) \/>/
匹配首尾空格的正則表達式：(^\s*)\|(\s*$)
匹配Email地址的正則表達式：\w+(\[-+.\]\w+)*@\w+(\[-.\]\w+)*\.\w+(\[-.\]\w+)\*
匹配網址URL的正則表達式：^\[a-zA-z\]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$
匹配帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^\[a-zA-Z\]\[a-zA-Z0-9_\]{4,15}$
匹配國內電話號碼：(\d{3}-\|\d{4}-)?(\d{8}\|\d{7})?
匹配騰訊QQ號：^\[1-9\]*\[1-9\]\[0-9\]*$

元字符及其在正則表達式上下文中的行為
\ 將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。
^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的Multiline 屬性，\^ 也匹配 '\n' 或 '\r' 之后的位置。
$ 匹配輸入字符串的結束位置。如果設置了 RegExp 對象的Multiline 屬性，$ 也匹配 '\n' 或 '\r' 之前的位置。
\* 匹配前面的子表達式零次或多次。
+ 匹配前面的子表達式一次或多次。\+ 等價于 {1,}。
? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。

{n} n 是一個非負整數，匹配確定的n 次。
{n,} n 是一個非負整數，至少匹配n 次。
{n,m} m 和 n 均為非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

? 當該字符緊跟在任何一個其他限制符 (*, \+, ?, {n}, {n,}, {n,m}) 后面時，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串，而默認的貪婪模式則盡可能多的匹配所搜索的字符串。
. 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符，請使用象 '\[.\n\]' 的模式。

(pattern) 匹配pattern 并獲取這一匹配。
(?:pattern) 匹配pattern 但不獲取匹配結果，也就是說這是一個非獲取匹配，不進行存儲供以后使用。
(?=pattern) 正向預查，在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配，也就是說，該匹配不需要獲取供以后使用。
(?\!pattern) 負向預查，與(?=pattern)作用相反

x\|y 匹配 x 或 y。
\[xyz\] 字符集合。
\[^xyz\] 負值字符集合。
\[a-z\] 字符范圍，匹配指定范圍內的任意字符。
\[^a-z\] 負值字符范圍，匹配任何不在指定范圍內的任意字符。

\b 匹配一個單詞邊界，也就是指單詞和空格間的位置。
\B 匹配非單詞邊界。
\cx 匹配由x指明的控制字符。
\d 匹配一個數字字符。等價于 \[0-9\]。
\D 匹配一個非數字字符。等價于 \[^0-9\]。
\f 匹配一個換頁符。等價于 \x0c 和 \cL。
\n 匹配一個換行符。等價于 \x0a 和 \cJ。
\r 匹配一個回車符。等價于 \x0d 和 \cM。
\s 匹配任何空白字符，包括空格、制表符、換頁符等等。等價于\[ \f\n\r\t\v\]。
\S 匹配任何非空白字符。等價于 \[\^ \f\n\r\t\v\]。
\t 匹配一個制表符。等價于 \x09 和 \cI。
\v 匹配一個垂直制表符。等價于 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字符。等價于'\[A-Za-z0-9_\]'。
\W 匹配任何非單詞字符。等價于 '\[^A-Za-z0-9_\]'。

\xn 匹配 n，其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。
\num 匹配 num，其中num是一個正整數。對所獲取的匹配的引用。
\n 標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式，則 n 為后向引用。否則，如果 n 為八進制數字 (0-7)，則 n 為一個八進制轉義值。
\nm 標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式，則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取，則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足，若 n 和 m 均為八進制數字 (0-7)，則 \nm 將匹配八進制轉義值 nm。
\nml 如果 n 為八進制數字 (0-3)，且 m 和 l 均為八進制數字 (0-7)，則匹配八進制轉義值 nml。
\un 匹配 n，其中 n 是一個用四個十六進制數字表示的Unicode字符。

匹配中文字符的正則表達式： \[u4e00-u9fa5\]
匹配雙字節字符(包括漢字在內)：\[^x00-xff\]
匹配空行的正則表達式：n\[s\| \]*r
匹配HTML標記的正則表達式：/<(.*)>.*</1>\|<(.*) />/
匹配首尾空格的正則表達式：(^s*)\|(s*$)
匹配Email地址的正則表達式：w+(\[-+.\]w+)*@w+(\[-.\]w+)*.w+(\[-.\]w+)\*
匹配網址URL的正則表達式：http://(\[w-\]+.)+\[w-\]+(/\[w\- ./?%&=\]*)?

利用正則表達式限制網頁表單里的文本框輸入內容
1、用正則表達式限制只能輸入中文：onkeyup="value="/value.replace(/\["^u4E00-u9FA5\]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^u4E00-u9FA5\]/g,''))"

2、用正則表達式限制只能輸入全角字符： onkeyup="value="/value.replace(/\["^uFF00-uFFFF\]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^uFF00-uFFFF\]/g,''))"

3、用正則表達式限制只能輸入數字：onkeyup="value="/value.replace(/\["^d\]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/\[^d\]/g,''))"

4、用正則表達式限制只能輸入數字和英文：onkeyup="value="/value.replace(/\[W\]/g,"'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace

回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: JfreeChar 畫甘特圖時間軸(DateAxis)顯示格式問題的解決 java反射機制的小例子 jbmp - 1 在項目中配置log4j 過濾標簽常用正則表達一個簡單的ftp客戶端程序如何使用單元測試Junit

主站蜘蛛池模板：吴堡县| 湖口县| 尼木县| 富平县| 洪泽县| 庆城县| 青浦区| 万年县| 晋宁县| 九寨沟县| 收藏| 新平| 阿拉善盟| 镇江市| 将乐县| 额尔古纳市| 翁牛特旗| 邳州市| 隆德县| 兴义市| 缙云县| 大港区| 高要市| 抚远县| 松阳县| 东乡族自治县| 长乐市| 侯马市| 开江县| 集贤县| 敦煌市| 盐城市| 志丹县| 朝阳区| 江西省| 兴文县| 麟游县| 石家庄市| 云安县| 黔江区| 边坝县|

留言簿(3)

隨筆分類(19)

搜索

最新隨筆

最新評論

閱讀排行榜

評論排行榜

常用正則表達式