有個朋友問我,怎么判斷一個字符串中的某一位是數字,于是在網上幫他找,因為昨天剛學了點正則,還不會用(見笑)。但是有幸遇到一篇全面的文章。 由于還沒學會貼圖片我就直接貼網址啦
http://www.ccw.com.cn/htm/app/aprog/01_7_31_4.asp
這篇文章整理得很詳細。不過對于急于解決問題的人來說,還有一個方法來判斷。
跟朋友說的時候,他說他想到了個好辦法Character.isDigit(ch);用這個方法,我想他是要把String拆成char了。在這個類里面有如下的方法:
static boolean isDefined(char ch)
static boolean isDigit(char ch)
static boolean isIdentifierIgnorable(char ch)
static boolean isISOControl(char ch)
static boolean isJavaIdentifierPart(char ch)
static boolean isJavaIdentifierStart(char ch)
static boolean isJavaLetter(char ch)
static boolean isJavaLetterOrDigit(char ch)
static boolean isLetter(char ch)
static boolean isLetterOrDigit(char ch)
static boolean isLowerCase(char ch)
static boolean isMirrored(char c)
static boolean isSpace(char ch)
static boolean isSpaceChar(char ch)
static boolean isTitleCase(char ch)
static boolean isUnicodeIdentifierPart(char ch)
static boolean isUnicodeIdentifierStart(char ch)
static boolean isUpperCase(char ch)
static boolean isWhitespace(char ch)
把String拆成char之后就可以這樣判斷了,沒有測過那種更好,見仁見智啦。
以下文章來自:
http://publishblog.blogchina.com/blog/tb.b?diaryID=5453641
JavaScript 正則表達式
- //校驗是否全由數字組成
- function isDigit(s)
- {
- var patrn=/^[0-9]{1,20}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗登錄名:只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串
- function isRegisterUserName(s)
- {
- var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗用戶姓名:只能輸入1-30個以字母開頭的字串
- function isTrueName(s)
- {
- var patrn=/^[a-zA-Z]{1,30}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- }}
- //校驗密碼:只能輸入6-20個字母、數字、下劃線
- {{{
- function isPasswd(s)
- {
- var patrn=/^(\w){6,20}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗普通電話、傳真怕耄嚎梢浴?”開頭,除數字外,可含有“-”
- function isTel(s)
- {
- //var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?(\d){1,12})+$/;
- var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗手機號碼:必須以數字開頭,除數字外,可含有“-”
- function isMobil(s)
- {
- var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗郵政編碼
- function isPostalCode(s)
- {
- //var patrn=/^[a-zA-Z0-9]{3,12}$/;
- var patrn=/^[a-zA-Z0-9 ]{3,12}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- //校驗搜索關鍵字
- function isSearch(s)
- {
- var patrn=/^[^`~!@#$%^&*()+=|\\\][\]\{\}:;'\,.<>/?]{1}[^`~!@$%^&()+=|\\\]
- [\]\{\}:;'\,.<>?]{0,19}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- function isIP(s) //by zergling
- {
- var patrn=/^[0-9.]{1,20}$/;
- if (!patrn.exec(s)) return false
- return true
- }
- 正則表達式
- "^\\d+$" //非負整數(正整數 + 0)
- "^[0-9]*[1-9][0-9]*$" //正整數
- "^((-\\d+)|(0+))$" //非正整數(負整數 + 0)
- "^-[0-9]*[1-9][0-9]*$" //負整數
- "^-?\\d+$" //整數
- "^\\d+(\\.\\d+)?$" //非負浮點數(正浮點數 + 0)
- "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"
- //正浮點數
- "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$" //非正浮點數(負浮點數 + 0)
- "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"
- //負浮點數
- "^(-?\\d+)(\\.\\d+)?$" //浮點數
- "^[A-Za-z]+$" //由26個英文字母組成的字符串
- "^[A-Z]+$" //由26個英文字母的大寫組成的字符串
- "^[a-z]+$" //由26個英文字母的小寫組成的字符串
- "^[A-Za-z0-9]+$" //由數字和26個英文字母組成的字符串
- "^\\w+$" //由數字、26個英文字母或者下劃線組成的字符串
- "^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$" //email地址
- "^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$" //url
- "^[A-Za-z0-9_]*$"
正則表達式使用詳解
簡介
簡單的說,正則表達式是一種可以用于模式匹配和替換的強有力的工具。其作用如下:測試字符串的某個模式。例如,可以對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為數據有效性驗證。 替換文本。可以在文檔中使用一個正則表達式來標識特定文字,然后可以全部將其刪除,或者替換為別的文字。 根據模式匹配從字符串中提取一個子字符串。可以用來在文本或輸入字段中查找特定文字。
基本語法
在對正則表達式的功能和作用有了初步的了解之后,我們就來具體看一下正則表達式的語法格式。 正則表達式的形式一般如下:
/love/ 其中位于“/”定界符之間的部分就是將要在目標對象中進行匹配的模式。用戶只要把希望查找匹配對象的模式內容放入“/”定界符之間即可。為了能夠使用戶更加靈活的定制模式內容,正則表達式提供了專門的“元字符”。所謂元字符就是指那些在正則表達式中具有特殊意義的專用字符,可以用來規定其前導字符(即位于元字符前面的字符)在目標對象中的出現模式。 較為常用的元字符包括: “+”, “*”,以及 “?”。
“+”元字符規定其前導字符必須在目標對象中連續出現一次或多次。
“*”元字符規定其前導字符必須在目標對象中出現零次或連續多次。
“?”元字符規定其前導對象必須在目標對象中連續出現零次或一次。
下面,就讓我們來看一下正則表達式元字符的具體應用。
/fo+/ 因為上述正則表達式中包含“+”元字符,表示可以與目標對象中的 “fool”, “fo”, 或者 “football”等在字母f后面連續出現一個或多個字母o的字符串相匹配。
/eg*/ 因為上述正則表達式中包含“*”元字符,表示可以與目標對象中的 “easy”, “ego”, 或者 “egg”等在字母e后面連續出現零個或多個字母g的字符串相匹配。
/Wil?/ 因為上述正則表達式中包含“?”元字符,表示可以與目標對象中的 “Win”, 或者“Wilson”,等在字母i后面連續出現零個或一個字母l的字符串相匹配。
有時候不知道要匹配多少字符。為了能適應這種不確定性,正則表達式支持限定符的概念。這些限定符可以指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配 n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。
{n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空格。
除了元字符之外,用戶還可以精確指定模式在匹配對象中出現的頻率。例如,/jim {2,6}/ 上述正則表達式規定字符m可以在匹配對象中連續出現2-6次,因此,上述正則表達式可以同jimmy或jimmmmmy等字符串相匹配。 在對如何使用正則表達式有了初步了解之后,我們來看一下其它幾個重要的元字符的使用方式。
\s:用于匹配單個空格符,包括tab鍵和換行符;
\S:用于匹配除單個空格符之外的所有字符;
\d:用于匹配從0到9的數字;
\w:用于匹配字母,數字或下劃線字符;
\W:用于匹配所有與\w不匹配的字符;
. :用于匹配除換行符之外的所有字符。
(說明:我們可以把\s和\S以及\w和\W看作互為逆運算) 下面,我們就通過實例看一下如何在正則表達式中使用上述元字符。 /\s+/ 上述正則表達式可以用于匹配目標對象中的一個或多個空格字符。 /\d000/ 如果我們手中有一份復雜的財務報表,那么我們可以通過上述正則表達式輕而易舉的查找到所有總額達千元的款項。 除了我們以上所介紹的元字符之外,正則表達式中還具有另外一種較為獨特的專用字符,即定位符。定位符用于規定匹配模式在目標對象中的出現位置。 較為常用的定位符包括: “^”, “$”, “\b” 以及 “\B”。
“^”定位符規定匹配模式必須出現在目標字符串的開頭
“$”定位符規定匹配模式必須出現在目標對象的結尾
“\b”定位符規定匹配模式必須出現在目標字符串的開頭或結尾的兩個邊界之一
“\B”定位符則規定匹配對象必須位于目標字符串的開頭和結尾兩個邊界之內,
即匹配對象既不能作為目標字符串的開頭,也不能作為目標字符串的結尾。
同樣,我們也可以把“^”和“$”以及“\b”和“\B”看作是互為逆運算的兩組定位符。舉例來說: /^hell/ 因為上述正則表達式中包含“^”定位符,所以可以與目標對象中以 “hell”, “hello”或“hellhound”開頭的字符串相匹配。 /ar$/ 因為上述正則表達式中包含“$”定位符,所以可以與目標對象中以 “car”, “bar”或 “ar” 結尾的字符串相匹配。 /\bbom/ 因為上述正則表達式模式以“\b”定位符開頭,所以可以與目標對象中以 “bomb”, 或 “bom”開頭的字符串相匹配。/man\b/ 因為上述正則表達式模式以“\b”定位符結尾,所以可以與目標對象中以 “human”, “woman”或 “man”結尾的字符串相匹配。 為了能夠方便用戶更加靈活的設定匹配模式,正則表達式允許使用者在匹配模式中指定某一個范圍而不局限于具體的字符。例如:
/[A-Z]/ 上述正則表達式將會與從A到Z范圍內任何一個大寫字母相匹配。
/[a-z]/ 上述正則表達式將會與從a到z范圍內任何一個小寫字母相匹配。
/[0-9]/ 上述正則表達式將會與從0到9范圍內任何一個數字相匹配。
/([a-z][A-Z][0-9])+/ 上述正則表達式將會與任何由字母和數字組成的字符串,如 “aB0” 等相匹配。
這里需要提醒用戶注意的一點就是可以在正則表達式中使用 “()” 把字符串組合在一起。“()”符號包含的內容必須同時出現在目標對象中。因此,上述正則表達式將無法與諸如 “abc”等的字符串匹配,因為“abc”中的最后一個字符為字母而非數字。 如果我們希望在正則表達式中實現類似編程邏輯中的“或”運算,在多個不同的模式中任選一個進行匹配的話,可以使用管道符 “|”。例如:/to|too|2/ 上述正則表達式將會與目標對象中的 “to”, “too”, 或 “2” 相匹配。正則表達式中還有一個較為常用的運算符,即否定符 “[^]”。與我們前文所介紹的定位符 “^” 不同,否定符 “[^]”規定目標對象中不能存在模式中所規定的字符串。例如:/[^A-C]/ 上述字符串將會與目標對象中除A,B,和C之外的任何字符相匹配。一般來說,當“^”出現在 “[]”內時就被視做否定運算符;而當“^”位于“[]”之外,或沒有“[]”時,則應當被視做定位符。最后,當用戶需要在正則表達式的模式中加入元字符,并查找其匹配對象時,可以使用轉義符“\”。例如:/Th\*/ 上述正則表達式將會與目標對象中的“Th*”而非“The”等相匹配。在構造正則表達式之后,就可以象數學表達式一樣來求值,也就是說,可以從左至右并按照一個優先級順序來求值。優先級如下:
- 1.\ 轉義符
- 2.(), (?:), (?=), [] 圓括號和方括號
- 3.*, +, ?, {n}, {n,}, {n,m} 限定符
- 4.^, $, \anymetacharacter 位置和順序
- 5.|“或”操作
在JavaScript 1.2中帶有一個功能強大的RegExp()對象,可以用來進行正則表達式的匹配操作。其中的test()方法可以檢驗目標對象中是否包含匹配模式,并相應的返回true或false。我們可以使用JavaScript編寫以下腳本,驗證用戶輸入的郵件地址的有效性。
- <html>
- <head>
- <script language="Javascript1.2">
- <!-- start hiding
- function verifyAddress(obj)
- {
- var email = obj.email.value;
- var pattern =
- /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
- flag = pattern.test(email);
- if(flag)
- {
- alert(“Your email address is correct!”);
- return true;
- }
- else
- {
- alert(“Please try again!”);
- return false;
- }
- }
- // stop hiding -->
- </script>
- </head>
- <body>
- <form onSubmit="return verifyAddress(this);">
- <input name="email" type="text">
- <input type="submit">
- </form>
- </body>
- </html>
正則表達式對象
本對象包含正則表達式模式以及表明如何應用模式的標志。
語法 1 re = /pattern/[flags]
語法 2 re = new RegExp("pattern",["flags"])
參數 re 必選項。將要賦值為正則表達式模式的變量名。
Pattern 必選項。要使用的正則表達式模式。如果使用語法 1,用 "/" 字符分隔模式。如果用語法 2,用引號將模式引起來。
Flags 可選項。如果使用語法 2 要用引號將 flag 引起來。標志可以組合使用,可用的有:
g (全文查找出現的所有 pattern)
i (忽略大小寫)
m (多行查找)
示例
下面的示例創建一個包含正則表達式模式及相關標志的對象(re),向您演示正則表達式對象的用法。在本例中,作為結果的正則表達式對象又用于 match 方法中:
- function MatchDemo()
- {
- var r, re; // 聲明變量。
- var s = "The rain in Spain falls mainly in the plain";
- re = new RegExp("ain","g"); // 創建正則表達式對象。
- r = s.match(re); // 在字符串 s 中查找匹配。
- return(r);
- }
返回值: ain,ain,ain,ain
屬性 lastIndex 屬性 | source 屬性
方法 compile 方法 | exec 方法 | test 方法
要求 版本 3
請參閱 RegExp 對象 | 正則表達式語法 | String 對象
exec 方法
用正則表達式模式在字符串中運行查找,并返回包含該查找結果的一個數組。 rgExp.exec(str)
參數
rgExp 必選項。包含正則表達式模式和可用標志的正則表達式對象。
str 必選項。要在其中執行查找的 String 對象或字符串文字。
說明
如果 exec 方法沒有找到匹配,則它返回 null。如果它找到匹配,則 exec 方法返回一個數組,并且更新全局 RegExp 對象的屬性,以反映匹配結果。數組的0元素包含了完整的匹配,而第1到n元素中包含的是匹配中出現的任意一個子匹配。這相當于沒有設置全局標志 (g) 的 match 方法。如果為正則表達式設置了全局標志,exec 從以 lastIndex 的值指示的位置開始查找。如果沒有設置全局標志,exec 忽略 lastIndex 的值,從字符串的起始位置開始搜索。
exec 方法返回的數組有三個屬性,分別是 input、index 和 lastIndex。Input 屬性包含了整個被查找的字符串。Index 屬性中包含了整個被查找字符串中被匹配的子字符串的位置。LastIndex 屬性中包含了匹配中最后一個字符的下一個位置。
示例
下面的例子舉例說明了 exec 方法的用法:
- function RegExpTest()
- {
- var ver = Number(ScriptEngineMajorVersion() + "." + ScriptEngineMinorVersion())
- if (ver >= 5.5){ // 測試 JScript 的版本。
- var src = "The rain in Spain falls mainly in the plain.";
- var re = /\w+/g; // 創建正則表達式模式。
- var arr;
- while ((arr = re.exec(src)) != null)
- document.write(arr.index + "-" + arr.lastIndex + arr + "\t");
- }
- else{
- alert("請使用 JScript 的更新版本");
- }
- }
返回值:0-3The 4-8rain 9-11in 12-17Spain 18-23falls 24-30mainly 31-33in 34-37the 38-43plain
test 方法
返回一個 Boolean 值,它指出在被查找的字符串中是否存在模式。 rgexp.test(str)
參數
rgexp 必選項。包含正則表達式模式或可用標志的正則表達式對象。
str 必選項。要在其上測試查找的字符串。
說明 test 方法檢查在字符串中是否存在一個模式,如果存在則返回 true,否則就返回 false。全局 RegExp 對象的屬性不由 test 方法來修改。
示例下面的例子舉例說明了 test 方法的用法:
- function TestDemo(re, s)
- {
- var s1; // 聲明變量。
- // 檢查字符串是否存在正則表達式。
- if (re.test(s)) // 測試是否存在。
- s1 = " contains "; // s 包含模式。
- else
- s1 = " does not contain "; // s 不包含模式。
- return("'" + s + "'" + s1 + "'"+ re.source + "'"); // 返回字符串。
- }
函數調用:document.write (TestDemo(/ain+/ ,"The rain in Spain falls mainly in the plain."));
返回值:'The rain in Spain falls mainly in the plain.' contains 'ain+'
match 方法
使用正則表達式模式對字符串執行查找,并將包含查找的結果作為數組返回。
stringObj.match(rgExp)
參數
stringObj 必選項。對其進行查找的 String 對象或字符串文字。
rgExp 必選項。為包含正則表達式模式和可用標志的正則表達式對象。也可以是包含正則表達式模式和可用標志的變量名或字符串文字。
說明
如果 match 方法沒有找到匹配,返回 null。如果找到匹配返回一個數組并且更新全局 RegExp 對象的屬性以反映匹配結果。 match 方法返回的數組有三個屬性:input、index 和 lastIndex。Input 屬性包含整個的被查找字符串。Index 屬性包含了在整個被查找字符串中匹配的子字符串的位置。LastIndex 屬性包含了最后一次匹配中最后一個字符的下一個位置。如果沒有設置全局標志 (g),數組的 0 元素包含整個匹配,而第 1 到 n 元素包含了匹配中曾出現過的任一個子匹配。這相當于沒有設置全局標志的 exec 方法。如果設置了全局標志,元素 0 到 n 中包含所有匹配。
示例
下面的示例演示了match 方法的用法:
- function MatchDemo()
- {
- var r, re; // 聲明變量。
- var s = "The rain in Spain falls mainly in the plain";
- re = /ain/i; // 創建正則表達式模式。
- r = s.match(re); // 嘗試匹配搜索字符串。
- return(r); // 返回第一次出現 "ain" 的地方。
- }
- 返回值:ain
- 本示例說明帶 g 標志設置的 match 方法的用法。
- function MatchDemo()
- {
- var r, re; // 聲明變量。
- var s = "The rain in Spain falls mainly in the plain";
- re = /ain/ig; // 創建正則表達式模式。
- r = s.match(re); // 嘗試去匹配搜索字符串。
- return(r); // 返回的數組包含了所有 "ain"
- // 出現的四個匹配。
- }
返回值:ain,ain,ain,ain
上面幾行代碼演示了字符串文字的 match 方法的用法。
var r, re = "Spain";
r = "The rain in Spain".replace(re, "Canada");
return r;
返回值:The rain in Canada
search 方法
返回與正則表達式查找內容匹配的第一個子字符串的位置。
stringObj.search(rgExp)
參數
stringObj 必選項。要在其上進行查找的 String 對象或字符串文字。
rgExp 必選項。包含正則表達式模式和可用標志的正則表達式對象。
說明
search 方法指明是否存在相應的匹配。如果找到一個匹配,search 方法將返回一個整數值,指明這個匹配距離字符串開始的偏移位置。如果沒有找到匹配,則返回 -1。
示例
下面的示例演示了 search 方法的用法。
- function SearchDemo()
- {
- var r, re; // 聲明變量。
- var s = "The rain in Spain falls mainly in the plain.";
- re = /falls/i; // 創建正則表達式模式。
- r = s.search(re); // 查找字符串。
- return(r); // 返回 Boolean 結果。
- }
返回值:18
正則表達式語法
一個正則表達式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。
這里有一些可能會遇到的正則表達式示例:
JScript VBScript 匹配
/^\[ \t]*$/ "^\[ \t]*$" 匹配一個空白行。
/\d{2}-\d{5}/ "\d{2}-\d{5}" 驗證一個ID 號碼是否由一個2位數字,一個連字符以及一個5位數字組成。
/<(.*)>.*<\/\1>/ "<(.*)>.*<\/\1>" 匹配一個 HTML 標記。
下表是元字符及其在正則表達式上下文中的行為的一個完整列表:
字符 描述 \ 將下一個字符標記為一個特殊字符、或一個原義字符、或一個 后向引用、或一個八進制轉義符。例如,'n' 匹配字符 "n"。'\n' 匹配一個換行符。序列 '
' 匹配 "\" 而 "\(" 則匹配 "("。
^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '\n' 或 '\r' 之后的位置。
$ 匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '\n' 或 '\r' 之前的位置。
• 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價于{0,}。
+ 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價于 {1,}。
? 匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價于 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。
{n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空格。
? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。例如,對于字符串 "oooo",'o+?' 將匹配單個 "o",而 'o+' 將匹配所有 'o'。
. 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用象 '[.\n]' 的模式。 (pattern) 匹配pattern 并獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到,在VBScript 中使用 SubMatches 集合,在JScript 中則使用 $0…$9 屬性。要匹配圓括號字符,請使用 '\(' 或 '\)'。
(?:pattern) 匹配 pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是很有用。例如, 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式。
(?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如, 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預查的字符之后開始。
(?!pattern) 負向預查,在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預查的字符之后開始
x|y 匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。
[xyz] 字符集合。匹配所包含的任意一個字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。
[^xyz] 負值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。
[a-z] 字符范圍。匹配指定范圍內的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 范圍內的任意小寫字母字符。
[^a-z] 負值字符范圍。匹配任何不在指定范圍內的任意字符。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范圍內的任意字符。
\b 匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\cx 匹配由x指明的控制字符。例如, \cM 匹配一個 Control-M 或回車符。 x 的值必須為 A-Z 或 a-z 之一。否則,將 c 視為一個原義的 'c' 字符。
\d 匹配一個數字字符。等價于 [0-9]。
\D 匹配一個非數字字符。等價于 [^0-9]。
\f 匹配一個換頁符。等價于 \x0c 和 \cL。
\n 匹配一個換行符。等價于 \x0a 和 \cJ。
\r 匹配一個回車符。等價于 \x0d 和 \cM。
\s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于 [ \f\n\r\t\v]。
\S 匹配任何非空白字符。等價于 [^ \f\n\r\t\v]。
\t 匹配一個制表符。等價于 \x09 和 \cI。
\v 匹配一個垂直制表符。等價于 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]'。
\W 匹配任何非單詞字符。等價于 '[^A-Za-z0-9_]'。
\xn 匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如, '\x41' 匹配 "A"。'\x041' 則等價于 '\x04' & "1"。正則表達式中可以使用 ASCII 編碼。.
\num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。例如,'(.)\1' 匹配兩個連續的相同字符。
\n 標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進制數字 (0-7),則 n 為一個八進制轉義值。
\nm 標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 \nm 將匹配八進制轉義值 nm。
\nml 如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值 nml。
\un 匹配 n,其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如, \u00A9 匹配版權符號 (?)。
優先權順序
在構造正則表達式之后,就可以象數學表達式一樣來求值,也就是說,可以從左至右并按照一個優先權順序來求值。
下表從最高優先級到最低優先級列出各種正則表達式操作符的優先權順序:
操作符 描述
\ 轉義符
(), (?:), (?=), [] 圓括號和方括號
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, \anymetacharacter 位置和順序
| “或”操作
普通字符
普通字符由所有那些未顯式指定為元字符的打印和非打印字符組成。這包括所有的大寫和小寫字母字符,所有數字,所有標點符號以及一些符號。
最簡單的正則表達式是一個單獨的普通字符,可以匹配所搜索字符串中的該字符本身。例如,單字符模式 'A' 可以匹配所搜索字符串中任何位置出現的字母 'A'。這里有一些單字符正則表達式模式的示例:
/a/
/7/
/M/
等價的 VBScript 單字符正則表達式為:
"a"
"7"
"M"
可以將多個單字符組合在一起得到一個較大的表達式。例如,下面的 JScript 正則表達式不是別的,就是通過組合單字符表達式 'a'、'7'以及 'M' 所創建出來的一個表達式。
/a7M/ 等價的 VBScript 表達式為:
"a7M" 請注意這里沒有連接操作符。所需要做的就是將一個字符放在了另一個字符后面。
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1401201