- ?概念及其作用
???????????正則表達(dá)式的英文是regular expression,正則表達(dá)式,就是用某種模式去匹配一類字符串的一個(gè)公式。
?????????? 正則表達(dá)式具有如下作用:
????????????1)測(cè)試字符串的某種模式。eg. 檢驗(yàn)在某個(gè)字符串中是否存在一個(gè)電話號(hào)碼和一個(gè)身份證號(hào)碼;
????????????2)替換文本。eg. 在文本中使用一個(gè)正則表達(dá)式來標(biāo)識(shí)特定文字,將其替換成其他文字;
??????????? 3)根據(jù)指定的模式從字符串中提取一個(gè)子字符串。
??? 2.???元字符及描述
元字符 | ? | 描述 |
---|---|---|
|
|
|
|
匹配任何單個(gè)字符。例如正則表達(dá)式r.t匹配這些字符串:rat、rut、r t,但是不匹配root。? | |
|
匹配行結(jié)束符。例如正則表達(dá)式weasel$ 能夠匹配字符串"He's a weasel"的末尾,但是不能匹配字符串"They are a bunch of weasels."。? | |
|
匹配一行的開始。例如正則表達(dá)式^When in能夠匹配字符串"When in the course of human events"的開始,但是不能匹配"What and When in the"。 | |
|
匹配0或多個(gè)正好在它之前的那個(gè)字符。例如"zo*"可以匹配"z"和"zoo"等。 | |
|
這是引用符,用來將這里列出的這些元字符當(dāng)作普通的字符來進(jìn)行匹配。例如正則表達(dá)式\$被用來匹配美元符號(hào),而不是行尾,類似的,正則表達(dá)式\.用來匹配點(diǎn)字符,而不是任何字符的通配符。 | |
[c 1 -c 2 ] [^c 1 -c 2 ] |
匹配括號(hào)中的任何一個(gè)字符。例如正則表達(dá)式r[aou]t匹配rat、rot和rut,但是不匹配ret??梢栽诶ㄌ?hào)中使用連字符-來指定字符的區(qū)間,例如正則表達(dá)式[0-9]可以匹配任何數(shù)字字符;還可以制定多個(gè)區(qū)間,例如正則表達(dá)式[A-Za-z]可以匹配任何大小寫字母。另一個(gè)重要的用法是“排除”,要想匹配除了指定區(qū)間之外的字符——也就是所謂的補(bǔ)集——在左邊的括號(hào)和第一個(gè)字符之間使用^字符,例如正則表達(dá)式[^269A-Z] 將匹配除了2、6、9和所有大寫字母之外的任何字符。 | |
|
匹配詞(word)的開始(\<)和結(jié)束(\>)。例如正則表達(dá)式\<the能夠匹配字符串"for the wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:這個(gè)元字符不是所有的軟件都支持的。 | |
|
將 \( 和 \) 之間的表達(dá)式定義為“組”(group),并且將匹配這個(gè)表達(dá)式的字符保存到一個(gè)臨時(shí)區(qū)域(一個(gè)正則表達(dá)式中最多可以保存9個(gè)),它們可以用 \1 到\9 的符號(hào)來引用。 | |
|
將兩個(gè)匹配條件進(jìn)行邏輯“或”(Or)運(yùn)算。例如正則表達(dá)式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:這個(gè)元字符不是所有的軟件都支持的。 | |
|
匹配1或多個(gè)正好在它之前的那個(gè)字符。例如正則表達(dá)式9+匹配9、99、999等。注意:這個(gè)元字符不是所有的軟件都支持的。 | |
|
匹配0或1個(gè)正好在它之前的那個(gè)字符。例如,abc?能匹配abc和ab,注意:這個(gè)元字符不是所有的軟件都支持的。 | |
\{ i , j \} |
匹配指定數(shù)目的字符,這些字符是在它之前的表達(dá)式定義的。例如正則表達(dá)式A[0-9]\{3\} 能夠匹配字符"A"后面跟著正好3個(gè)數(shù)字字符的串,例如A123、A348等,但是不匹配A1234。而正則表達(dá)式[0-9]\{4,6\} 匹配連續(xù)的任意4個(gè)、5個(gè)或者6個(gè)數(shù)字字符。注意:這個(gè)元字符不是所有的軟件都支持的。 |
????3.???RegExp對(duì)象的屬性和方法
???????? 1)簡述
???????????? 該對(duì)象用來完成有關(guān)正則表達(dá)式的操作和功能;每一條正則表達(dá)式模式對(duì)應(yīng)一個(gè)RegExp實(shí)例,創(chuàng)建RegExp對(duì)象的方式如下:
???????????? 顯式構(gòu)造函數(shù):new ReExp("pattern"[,"flags"]);
???????????? 隱式構(gòu)造函數(shù)(此方法比較常用),采用純文本方式:/pattern/[flags].
???????????? 其中pattern部分為要使用的正則表達(dá)式模式文本,是必須的,flags部分設(shè)置正則表達(dá)式的標(biāo)志信息,為可選項(xiàng)。flags可以是如下標(biāo)記的組合:
??????????? g是全局標(biāo)志。若設(shè)置了這個(gè)標(biāo)志,對(duì)某個(gè)文本執(zhí)行搜索和替換操作時(shí),將對(duì)文本所有匹配的部分起作用,否則,則僅搜索和替換最早匹配的內(nèi)容;
??????????? i是忽略大小寫標(biāo)志;
??????????? m是多行標(biāo)志.
??????????? eg.



























?????????輸出結(jié)果如下:
???????????regex: /amigo/
?????????? 找到指定字符串a(chǎn)migo
?????????? 找到指定字符串a(chǎn)migo
??????? 注意:?由于JavaScript字符串中"\"是一個(gè)轉(zhuǎn)義字符,因此顯式構(gòu)造函數(shù)創(chuàng)建RegExp實(shí)例對(duì)象時(shí),應(yīng)將原是政則表達(dá)式的"\"用"\\"替換.
??????? eg.










???????輸出結(jié)果如下:
??????? regex1: /\d{3}/
??????? regex2: /\d{3}/
??????? 由于正則表達(dá)式模式文本中的轉(zhuǎn)義字符也是"\",如果正則表達(dá)式中要匹配原義字符"\",在正則表達(dá)式模式文本中要以"\\"表示,當(dāng)顯式的方式來表示時(shí),要用"\\\\"來表示原義字符"\".
????? 2).????屬性
????????? 1)?index:? 當(dāng)前表達(dá)式模式首次匹配內(nèi)容的開始位置,從0開始計(jì)數(shù),?初始值為-1;
??????????2)?input:?? 返回當(dāng)前所作用的字符串;
????????? 3)lastIndex:?? 是當(dāng)前表達(dá)式模式首次匹配內(nèi)容中最后一個(gè)字符的下一個(gè)位置;
??????????4)lastMatch:?? 是當(dāng)前表達(dá)式模式的最后一個(gè)匹配字符串;
????????? 5)lastParen:?? 是當(dāng)前表達(dá)式模式中最后的子匹配所匹配的子字符串;
??????????6)leftContext:???當(dāng)前表達(dá)式模式最后一個(gè)匹配字符串左邊的所有內(nèi)容;
????????? 7)rightContext:??當(dāng)前表達(dá)式模式最后一個(gè)匹配字符串右邊的所有內(nèi)容;??
??????????上面所說的屬性為其靜態(tài)屬性,下面是其實(shí)例屬性:
??????????1) global:???返回標(biāo)志g的狀態(tài);
????????? 2) ignoreCase:???返回標(biāo)志i的狀態(tài);
??????????3) multiLine:? 返回標(biāo)志m的狀態(tài);
??????????4) source:? 返回創(chuàng)建RegExp對(duì)象實(shí)例時(shí)指定的表達(dá)式文本字符串.
????? 3)? 方法
??????????? test方法
??????????? exe方法: 語法格式為exex(str).該方法使用創(chuàng)建RegExp對(duì)象實(shí)例時(shí)所指定的表達(dá)式模式對(duì)一個(gè)字符串進(jìn)行搜索.
????????????compile方法: 語法格式為compile("pattern"[,"flags"]),該方法可以更換RegExp對(duì)象實(shí)例所使用的表達(dá)式模式,并將新的表達(dá)式編譯為內(nèi)部格式,從而使以后的匹配過程執(zhí)行更快.
??????????? 綜合舉例:




























????????? source: (\d{8})amigo(\d{4})
?????????RegExp.index: 0
?????????RegExp.lastIndex: 17
?????????RegExp.lastParen: 1121
?????????RegExp.leftContext:
?????????RegExp.rightContext;??happy
?????????attr.index: 0
?????????attr.lastIndex: 17
??? 4.???常用驗(yàn)證收集
?????????1) 匹配中文字符的正則表達(dá)式: [\u4e00-\u9fa5]
?????????2) 匹配雙字節(jié)字符(包括漢字在內(nèi)):[^\x00-\xff]
?????????3) 匹配空白行的正則表達(dá)式:\n\s*\r
?????????4) 匹配HTML標(biāo)記的正則表達(dá)式:<(\S*?)[^>]*>.*?</\1>|<.*? />
????????????評(píng)注:上面這個(gè)也僅僅能匹配部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無能為力
?????????5) 匹配首尾空白字符的正則表達(dá)式:^\s*|\s*$
????????????評(píng)注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式
?????????6) 匹配Email地址的正則表達(dá)式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
?????????7) 匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^\s]*
????????????評(píng)注:上面這個(gè)基本可以滿足需求
?????????8) 匹配帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
?????????9) 匹配國內(nèi)電話號(hào)碼:\d{3}-\d{8}|\d{4}-\d{7}
????????????評(píng)注:匹配形式如 0511-4405222 或 021-87888822
?????????10) 匹配騰訊QQ號(hào):[1-9][0-9]{4,}
????????????評(píng)注:騰訊QQ號(hào)從10000開始
?????????11) 匹配中國郵政編碼:[1-9]\d{5}(?!\d)?????? (注: 中國郵政編碼為6位數(shù)字)
?????????12) 匹配身份證:\d{15}|\d{18}? (注: 中國的身份證為15位或18位)
?????????13) 匹配ip地址:\d+\.\d+\.\d+\.\d+
?????????14) 匹配特定數(shù)字:
????????????^[1-9]\d*$ //匹配正整數(shù)
????????????^-[1-9]\d*$ //匹配負(fù)整數(shù)
????????????^-?[1-9]\d*$ //匹配整數(shù)
????????????^[1-9]\d*|0$ //匹配非負(fù)整數(shù)(正整數(shù) + 0)
????????????^-[1-9]\d*|0$ //匹配非正整數(shù)(負(fù)整數(shù) + 0)
????????????^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮點(diǎn)數(shù)
????????????^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配負(fù)浮點(diǎn)數(shù)
????????????^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點(diǎn)數(shù)
????????????^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
????????????^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)
????????????評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正
?????????15) 匹配特定字符串:
????????????^[A-Za-z]+$ //匹配由26個(gè)英文字母組成的字符串
????????????^[A-Z]+$ //匹配由26個(gè)英文字母的大寫組成的字符串
????????????^?[a-z]+$ //匹配由26個(gè)英文字母的小寫組成的字符串
????????????^[A-Za-z0-9]+$ //匹配由數(shù)字和26個(gè)英文字母組成的字符串
????????????^\w+$ //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
????????????評(píng)注:最基本也是最常用的一些表達(dá)式