正则表达式常用字符
特殊字符
- ^ 代表以后面字符开头,如^a就是以a开头
- $ 代表以前面字符结尾,如b$就是以b结尾
- . 代表任意字符
- * 代表前面字符可以重复任意多次,常与.连用
- ? 代表匹配前面的子表达式零次或一次,为非贪婪模式,可解决正则表达式的默认贪婪模式
- + 代表匹配前面的子表达式一次或多次。
- {n}代表匹配确定的 n 次,例如,’o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o。
- {n,}至少匹配n 次,例如,’o{2,}’ 不能匹配 “Bob” 中的 ‘o’,但能匹配 “foooood” 中的所有 o。
- {n,m}最少匹配 n 次且最多匹配 m 次,例如,”o{1,3}” 将匹配 “fooooood” 中的前三个 o。
- | 代表或,如x|y就是匹配 x 或 y
- [xyz] 代表匹配所包含的任意一个字符,例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。
- [^xyz] 代表匹配未包含的任意字符,例如, ‘[^abc]’ 可以匹配 “plain” 中的’p’、’l’、’i’、’n’。
- [a-z] 代表匹配指定范围内的任意字符。例如,'[a-z]’ 可以匹配 ‘a’ 到 ‘z’ 范围内的任意小写字母字符。
- [^a-z] 代表匹配任何不在指定范围内的任意字符。例如,'[^a-z]’ 可以匹配任何不在 ‘a’ 到 ‘z’ 范围内的任意字符。
- \s 代表匹配任何空白字符,包括空格、制表符、换页符等等。
- \S 代表匹配任何非空白字符。
- \w 代表匹配字母、数字、下划线。等价于'[A-Za-z0-9_]’。
- \W 代表匹配非字母、数字、下划线。等价于 ‘[^A-Za-z0-9_]’。
- \d 代表匹配一个数字字符。等价于 [0-9]。
- [\u4E00-\u9FA5] 代表匹配一个或多个汉字