预定义字符集
正则表达式中预定义了一些字符集,字符集能以简洁的方式表示一些由元字符和普通字符表示的匹配规则。常见的预定义字符集如表1所示。
表1 预定义字符集
预定义字符 | 说明 |
---|---|
\w | 匹配下划线“_”或任何字母(a-zA-Z)与数字(0-9) |
\s | 匹配任意的空白字符,等价于[<空格>\t\r\n\f\v] |
\d | 匹配任意数字,等价于[0-9] |
\b | 匹配单词的边界 |
\W | 与\w相反,匹配特殊字符 |
\S | 与\s相反,匹配任意非空白字符的字符,等价于[^\s] |
\D | 与\d相反,匹配任意非数字的字符,等价于[^\d] |
\B | 与\b相反,匹配不出现在单词边界的元素 |
\A | 仅匹配字符串开头,等价于^ |
\Z | 仅匹配字符串结尾,等价于$ |
例如,使用“\d”匹配字符串“Python123”中的任一数字,这里通过在线正则表达式测试工具进行演示,如图1所示。
>图1 “\d”匹配结果
由图1可知,使用元字符“\d”可将字符串中的数字匹配出。