模式名称 |
启用Q禁?br /> | ~省启用 |
说明 |
UNIX_LINES |
(?d)启用Q??-d)用 |
?br /> | 启用Unix行模式?br />在此模式下,只有 '\n'被认为是行结束符。它会媄?tt>., ^, ?$ 的行为?br /> |
CASE_INSENSITIVE |
(?i)启用Q??-i)用 |
?br /> | 启用忽略大小写模式?br />~省Ӟ忽略大小写模式只会媄?ASCII字符的匹配?而Unicode范围的忽略大写匚w需要通过 UNICODE_CASE 标志与本标志联合使用?br />启用此模式会影响匚w性能?br /> |
COMMENTS |
(?x)启用Q??-x)用 |
?br /> | 允许I格和注释出现在正则表达式中?br />在此模式下,I格被忽略,?开始的单行注释被忽略? |
MULTILINE |
(?m)启用Q??-m)用 |
?br /> | 启用多行模式?br />In multiline mode the expressions ^ and $ match just after or just before, respectively, a line terminator or the end of the input sequence. By default these expressions only match at the beginning and the end of the entire input sequence. |
DOTALL |
(?s)启用Q??-s)用 |
?br /> | ?可以匚w行结束符?br />在此模式下,元字W?tt>.可以匚w行结束符。缺省不允许如此匚w?br /> |
UNICODE_CASE |
(?u)启用Q??-u)用 |
?br /> | Enables Unicode-aware case folding. When this flag is specified then case-insensitive matching, when enabled by the CASE_INSENSITIVE flag, is done in a manner consistent with the Unicode Standard. By default, case-insensitive matching assumes that only characters in the US-ASCII charset are being matched. 启用此模式会影响性能?br /> |
CANON_EQ |
(?c)启用Q??-c)用 |
?br /> | Enables canonical equivalence. When this flag is specified then two characters will be considered to match if, and only if, their full canonical decompositions match. The expression "a\u030A", for example, will match the string "?" when this flag is specified. By default, matching does not take canonical equivalence into account. 启用此模式会影响性能?br /> |
正则表达式字W串 |
匚w的字W串 |
X |
字符XQ包?CJK ExtB 区汉?br /> |
\\ |
反斜杠\ |
\0n | 八进?n代表的字W?0<=n<=7) |
\0nn |
八进?nn代表的字W?0<=n<=7) |
\0mnn |
八进?mnn代表的字W?0<=m<=3,0<=n<=7) |
\xhh |
十六q制 0xhh所代表的字W?br /> |
\uhhhh |
十六q制 0xhhhh所代表的字W?font color="#ff0000">注意Q目前尚不支持CJK ExtB区汉字?br /> |
\t |
制表W?'\u0009') |
\n |
换行('\u000A') |
\r |
回R('\u000D') |
\a |
响铃W?'\u0007') |
\e |
取消WEscape('\001B') |
\cx |
x所代表的控制字W?br /> |
正则表达式字W串 |
匚w的字W串 |
XY |
X后面跟随Y |
X|Y |
X或?em>Y |
(X) |
X作ؓ分组表达?br /> |
正则表达式字W串 |
匚w的字W串 |
\n |
W?strong>n个匹配的分组 |
边界字符 |
匚w的字W串 |
^ |
行首 |
$ |
行末 |
\b | 字符边界 |
\B |
非字W边?br /> |
\A |
输入的开?br /> |
\G |
上次匚w的结束处 |
\Z |
输入的l束Q或者是最后一个行l束W,参见行结束符?br /> |
\z |
输入的l束 |
正则表达式字W串 |
匚w的字W串 |
X? |
X重复一ơ,或者不重复 |
X* |
X重复0ơ或多次 |
X+ |
X重复1ơ或多次 |
X{n} |
X重复nơ,不多也不?br /> |
X{n,} |
X臛_重复n?br /> |
X{n,m} |
X臛_重复nơ,臛_重复mơ?br /> |
正则表达式字W串子集 |
匚w的字W串 |
l合方式 |
[abc] |
字符a,b或cQ包?CJK ExtB 区汉?br /> | 单子?br /> |
[^abc] |
L非a,b或c的字W?br /> | 排除 |
[a-zA-Z] | 从a到zQ或者A到ZQ包含a,z,A,Z?br /> | 区间 |
[a-d[m-p]] |
从a到dQ或者m到pQ等于[a-dm-p]?br /> | 联合 |
[a-z&&[def]] |
d,e或者f?br /> | 交集 |
[a-z&&[^bc]] |
从a到zQ除了b和cQ等于[ad-z] |
扣除 |
[a-z&&[^m-p]] |
从a到zQƈ且不包括从m到pQ等于[a-lq-z] |
扣除 |
边界字符 |
匚w的字W串 |
. |
L字符Q可能匹配行l束W?br /> |
\d |
数字[0-9] |
\D | 非数字[^0-9] |
\s |
I白W[ \t\n\x0B\f\r] |
\S |
非空白符[^\s] |
\w |
单词W,包含有字母和数字[a-zA-Z_0-9] |
\W |
非单词符Q不包含有字母和数字?br /> |
正则表达式字W串 |
匚w的字W串 |
名称 |
块名Uͼ\p{InXXX}Q?br /> | 化通配W?br /> | 标准Unicode块,或者汉字列?br /> |
L双字节字W(汉字或全角符P |
\p{InQuqnJiao} |
\E |
L由GBK表示的汉字,不包括GB18030扩展部分Q?br />以及CJK ExtB区的汉字?br /> |
L单字节字W?br /> | \p{InFQuanJiao} |
\~E |
L单字节字W?br /> |
L全角ASCII字符 |
\p{InQJAscii} |
\H |
标准HalfwidthandFullwidthForms?br /> |
L收录在BIG5码集中的双字节字W?br /> | \p{InBig5} |
\I |
Big5可编码双字节字符 |
匚w未收录在BIG5码集中的双字节字W?/td> | \p{InFBig5} |
\~I |
非Big5可编码双字节字符 |
匚wL汉字(不包括符? |
\p{InHanziOrCJKExtB} |
\X |
L汉字Q包括GB18030扩展部分?br /> |
匚wL汉字(不包括符? |
\p{InHanzi} |
\M |
L汉字Q不包括GB18030扩展部分?br /> |
匚w非汉字的双字节字W?br /> | \p{InFHanzi} |
\~M |
L非汉字的双字节字W, 包括GB18030扩展部分?br /> |
地支字符 |
\p{InDiZhi} |
\U |
子丑寅卯辰埩午未申酉戌亥 |
匚w收录在GB码集中的双字节字W?br /> | \p{InGB} |
\g |
收录在GB码集中的双字节字W, 不包括GB18030扩展部分?br /> |
匚w非收录在GB码集中的双字节字W?br /> | \p{InFGB} |
\~g |
未收录在GB码集中的双字节字W, 不包括GB18030扩展部分?br /> |
匚w收录在GBK码集中的双字节字W?br /> | \p{InGBK} |
\h |
收录在GBK码集中的双字节字W, 不包括GB18030扩展部分?br /> |
匚w非收录在GBK码集中的双字节字W?br /> | \p{InFGBK} |
\~h |
未收录在GBK码集中的双字节字W, 不包括GB18030扩展部分?br /> |
大写希腊字母 |
\p{InDaXila} |
\K |
ΑΒΓΔΕΖΗΘΙΚΛΜΝ ΞΟΠΡΣΤΥΦΧΨΩ |
日文片假?br /> | \p{InPianJia} |
\j |
标准Katakana?br /> |
日文q_?br /> | \p{InPingJia} |
\J |
标准Hiragana?br /> |
写希腊字母 |
\p{InXiaoXila} |
\k |
αβγδεζηθικλμν ξοπρστυφχψω |
数学W号 |
\p{InMathe} |
\m |
±×÷∶∧∨∑∏∪∩∈∷√⊥∥∠⌒⊙ ∫∮≡≌≈∽∝≠≮≯≤≥∞∵∴ |
中文数字 |
\p{InCnDigit} |
\i |
〇一二三四五六七八九十百千万亿兆吉京 |
大写中文数字 |
\p{InDaCnDigit} |
\N |
零壹贰叁肆伍陆柒捌玖拾䘪仟萬亿兆吉京 |
全角标点W号 |
\p{InQJBiaoDian} |
\o |
、?#183;ˉˇ¨〃?#8212;?#8214;…‘’“”〔?br />〈〉《》「」『』〖〗【】!Q'Q)Q?br />Q.Q;Q=Q?Q]{|}`H﹊H﹌H﹎H﹐H﹒H﹕H﹗H﹚ H﹜H﹞|︶|ؓ|﹀|DH﹂H﹄ |Ӈ|P|x|?br /> |
写俄文字母 |
\p{InXiaoEWen} |
\l |
аб{Cеёжзийaxмн о\рстуфхцчшщъыьэюя |
大写俄文字母 |
\p{InDaEWen} |
\R |
АБВГДЕЁЖЗИЙКЛМНО ПРСТУФ[ЦЧШЩЪЫЬfy |
中文序号 |
\p{InCnSN} |
\q |
ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ 再加上Unicode标准EnclosedAlphanumerics?br /> |
天干字符 |
\p{InTianGan} |
\T |
甲乙丙丁戊己庚辛壬癸 |
竖排标点W号 |
\p{InSPBiaoDian} |
\V |
|︶|ؓ|﹀|DH﹂H﹄|Ӈ|P|x|?br /> |
拼音字符 |
\p{InPinyin} |
\y |
āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜüêɑńň GBK -> 0xA8A1- 0xA8C0 只是Unicode标准LatinExtended-A块的一部分?br /> |
注音字符 |
\p{InZhuyin} |
\Y |
标准Bopomofo?br /> |
制表字符 |
\p{InZhiBiao} |
\C |
标准BoxDrawing块?br />l检查发?textpro 的算法含有部分非?br />准Unicode制表W:“∟∣≒≦≧⊿═”?br /> |
正则表达式字W串 |
匚w的字W串 |
\p{Lower} |
写字母[a-z] |
\p{Upper} |
大写字母[A-Z] |
\p{ASCII} |
所有的ASCII字符[\x00-\x7F] |
\p{Alpha} |
大小写字母[\p{Lower}\p{Upper}] |
\p{Digit} |
数字[0-9] |
\p{Alnum} |
字母数字W,包含大小写字母和数字[\p{Alpha}\p{Digit}] |
\p{Punct} |
标点W号Q?"#$%&'()*+,-./:;<=>?@[\]^_`{|}~之一?br /> |
\p{Graph} |
可显C字W[\p{Alnum}\p{Punct}] |
\p{Print} |
可打印字W[\p{Graph}] |
\p{Blank} |
I格或者制表符[ \t] |
\p{Cntrl} |
控制字符[\x00-\x1F\x7F |
\p{XDigit} |
十六q制数字[0-9a-fA-F] |
\p{Space} |
I白W[ \t\n\x0B\f\r] |
?br /> | 中文名称Q摘自Word XPQ?br /> | 代码区域 |
BasicLatin |
基本拉丁?br /> | \u0000-\u007F |
Latin-1Supplement |
拉丁?1 |
\u0080-\u00FF |
LatinExtended-A |
拉丁语扩?A |
\u0100-\u017F |
LatinExtended-Bound |
拉丁语扩?B |
\u0180-\u024F |
IPAExtensions |
国际x扩充 |
\u0250-\u02AF |
SpacingModifierLetters |
q格的修饰字W?br /> | \u02B0-\u02FF |
CombiningDiacriticalMarks |
l合用发音符 |
\u0300-\u036F |
Greek |
基本希腊?br /> | \u0370-\u03FF |
Cyrillic |
襉K语 |
\u0400-\u04FF |
Armenian |
\u0530-\u058F | |
Hebrew |
\u0590-\u05FF | |
Arabic |
\u0600-\u06FF | |
Syriac |
\u0700-\u074F | |
Thaana |
\u0780-\u07BF | |
Devanagari |
\u0900-\u097F | |
Bengali |
\u0980-\u09FF | |
Gurmukhi |
\u0A00-\u0A7F | |
Gujarati |
\u0A80-\u0AFF | |
Oriya |
\u0B00-\u0B7F | |
Tamil |
\u0B80-\u0BFF | |
Telugu |
\u0C00-\u0C7F | |
Kannada |
\u0C80-\u0CFF | |
Malayalam |
\u0D00-\u0D7F | |
Sinhala |
\u0D800-\uDFF | |
Thai |
\u0E00-\u0E7F | |
Lao |
\u0E80-\u0EFF | |
Tibetan |
藏语 |
\u0F00-\u0FFF |
Myanmar |
\u1000-\u109F | |
Georgian |
\u10A0-\u10FF | |
HangulJamo |
\u1100-\u11FF | |
Ethiopic |
\u1200-\u137F | |
Cherokee |
\u13A0-\u13FF | |
UnifiedCanadianAboriginalSyllabics |
\u1400-\u167F | |
Ogham |
\u1680-\u169F | |
Runic |
\u16A0-\u16FF | |
Khmer |
\u1780-\u17FF | |
Mongolian |
蒙古?br /> | \u1800-\u18AF |
LatinExtendedAdditional |
\u1E00-\u1EFF | |
GreekExtended |
\u1F00-\u1FFF | |
GeneralPunctuation |
q义标点 |
\u2000-\u206F |
SuperscriptsandSubscripts |
\u2070-\u209F | |
CurrencySymbols |
货币W号 |
\u20A0-\u20CF |
CombiningMarksforSymbols |
\u20D0-\u20FF | |
LetterlikeSymbols |
cM字母的符?br /> | \u2100-\u214F |
NumberForms |
数字形式 |
\u2150-\u218F |
Arrows |
头 |
\u2190-\u21FF |
MathematicalOperators |
数学q算W?br /> | \u2200-\u22FF |
MiscellaneousTechnical |
零杂技术用W号 |
\u2300-\u23FF |
ControlPictures |
\u2400-\u243F | |
OpticalCharacterRecognition |
\u2440-\u245F | |
EnclosedAlphanumerics |
带括L字母数字 |
\u2460-\u24FF |
BoxDrawing |
制表W?br /> | \u2500-\u257F |
BlockElements |
方块囑Ş |
\u2580-\u259F |
GeometricShapes |
几何囑Ş |
\u25A0-\u25FF |
MiscellaneousSymbols |
零杂丁贝W(C意W等Q?br /> | \u2600-\u26FF |
Dingbats |
\u2700-\u27BF | |
BraillePatterns |
\u2800-\u28FF | |
CJKRadicalsSupplement |
\u2E80-\u2EFF | |
KangxiRadicals |
\u2F00-\u2FDF | |
IdeographicDescriptionCharacters |
\u2FF0-\u2FFF | |
CJKSymbolsandPunctuation |
CJKW号和标?br /> | \u3000-\u303F |
Hiragana |
q_?br /> | \u3040-\u309F |
Katakana |
片假?br /> | \u30A0-\u30FF |
Bopomofo |
注音 |
\u3100-\u312F |
HangulCompatibilityJamo |
\u3130-\u318F | |
Kanbun |
\u3190-\u319F | |
BopomofoExtended |
扩展注音 |
\u31A0-\u31BF |
EnclosedCJKLettersandMonths |
带括LCJK字母及月?br /> | \u3200-\u32FF |
CJKCompatibility |
CJK兼容字符 |
\u3300-\u33FF |
CJKUnifiedIdeographsExtensionA |
CJKl一汉字扩展-A |
\u3400-\u4dBF |
CJKUnifiedIdeographs |
CJKl一汉字 |
\u4E00-\u9fAF |
YiSyllables |
\uA000-\uA48F | |
YiRadicals |
\uA490-\uA4CF | |
HangulSyllables |
\uAC00-\uD7A3 | |
HighSurrogates |
\uD800-\uDB7F | |
HighPrivateUseSurrogates |
\uDB80-\uDBFF | |
LowSurrogates |
\uDC00-\uDFFF | |
PrivateUse |
专用?br /> | \uE000-\uF8FF |
CJKCompatibilityIdeographs |
CJK兼容汉字 |
\uF900-\uFAFF |
AlphabeticPresentationForms |
\uFB00-\uFB4F | |
ArabicPresentationForms-A |
\uFB50-\uFDFF | |
CombiningHalfMarks |
\uFE20-\uFE2F | |
CJKCompatibilityForms |
CJK兼容形式 |
\uFE30-\uFE4F |
SmallFormVariants |
写变体 |
\uFE50-\uFE6F |
ArabicPresentationForms-Bound |
\uFE70-\ufeFF | |
Specials |
\uFFF0-\uFFFF | |
HalfwidthandFullwidthForms |
半Ş及全形字W?br /> | \uFF00-\uFFEF |
分类 |
全称 |
说明 |
Cn |
UNASSIGNED | |
Lu |
UPPERCASE_LETTER | |
Ll |
LOWERCASE_LETTER | |
Lt |
TITLECASE_LETTER | |
Lm |
MODIFIER_LETTER | |
Lo |
OTHER_LETTER | |
Mn |
NON_SPACING_MARK | |
Me |
ENCLOSING_MARK | |
Mc |
COMBINING_SPACING_MARK | |
Nd |
DECIMAL_DIGIT_NUMBER | |
Nl |
LETTER_NUMBER | |
No |
OTHER_NUMBER | |
Zs |
SPACE_SEPARATOR | |
Zl |
LINE_SEPARATOR | |
Zp |
PARAGRAPH_SEPARATOR | |
Cc |
CNTRL | |
Cf |
FORMAT | |
Co |
PRIVATE_USE | |
Cs |
SURROGATE | |
Pd |
DASH_PUNCTUATION | |
Ps |
START_PUNCTUATION | |
Pe |
END_PUNCTUATION | |
Pc |
CONNECTOR_PUNCTUATION | |
Po |
OTHER_PUNCTUATION | |
Sm |
MATH_SYMBOL | |
Sc |
CURRENCY_SYMBOL | |
Sk |
MODIFIER_SYMBOL | |
So |
OTHER_SYMBOL | |
L |
LETTER | |
M |
MARK | |
N |
NUMBER | |
Z |
SEPARATOR | |
C |
CONTROL | |
P |
PUNCTUATION | |
S |
SYMBOL | |
LD |
LETTER_OR_DIGIT | |
L1 |
Latin-1 | |
all |
ALL | |
ASCII |
ASCII | |
Alnum |
字母数字(0-9,a-z,A-Z) | |
Alpha |
字母(a-z,A-Z) | |
Blank |
I格和制表符(' '|\t) | |
Cntrl |
控制字符Q不可打?br /> | |
Digit |
数字(0-9) | |
Graph |
可打C可视字母Q例如空? '是可打印的但不是可视字母Q?`a' 两者都是。) | |
Lower |
写字母 | |
Print |
可打印字母(非控制字W) | |
Punct |
标符P字母、数字、控制、空白符以外的字母)Q如Q?@#$%}{<>,./?[]{等?br /> | |
Space |
I白W?' ',\t,0x09,0x0A,0x0B,0x0C,0x0D,0x20) | |
Upper |
大写字母 | |
XDigit |
十六q制数字(0-9Qa-f, A-F) |
Ҏ字符介绍 |
描述 |
\n |
换行 |
\b |
向前删除一个字W。当q个字符位于替换串之首时Q将删除匚w串之前的一个字W。若匚w串位于行首,匚w串所在行与前一行相合ƈ?br /> |
\d |
向后删除一个字W。当q个字符位于替换串之末时Q将删除匚w串之后的一个字W。若匚w串位于行末,匚w串所在行与下一行相合ƈ?br /> |
\e |
插入一个ESC字符 |
\t |
插入一个TAB字符 |
\n |
n代表查找正则表达式中的子表达式(l)。\1代表W一个子表达式,\2代表W二个子表达式,依次cL。\0代表整个匚w到的字符丌Ӏ?br /> |
\v |
大写下一个字?br /> |
\U |
全部大写以后的字母,直到到其它指示Wؓ止?br /> |
\l |
写下一个字?br /> |
\L |
全部写以后的字母,直到到其它指示Wؓ止?br /> |
\E |
取消所有的字母大小写指C符?br /> |