re模块
Python中的re模块是正则表达式模块,该模块提供了文本匹配查找、文本替换、文本分割等功能。re模块中常用的函数及方法如表1所示。
表1 re模块函数及方法
函数/方法 | 说明 |
---|---|
compile() | 对正则表达式进行预编译,并返回一个Pattern对象 |
match() | 从头匹配,匹配成功返回匹配对象,失败返回None |
search() | 从任意位置开始匹配,匹配成功返回匹配对象,否则返回None |
split() | 将目标对象使用正则对象分割,成功返回匹配对象(是一个列表),可指定最大分割次数 |
findall() | 在目标对象中从左至右查找与正则对象匹配的所有非重叠子串,将这些子串组成一个列表并返回 |
finditer() | 功能与findall()相同,但返回的是迭代器对象iterator |
sub() | 搜索目标对象中与正则对象匹配的子串,使用指定字符串替换,并返回替换后的对象 |
subn() | 搜索目标对象中与正则对象匹配的子串,使用指定字符串替换,返回替换后的对象和替换次数 |
group() | 返回全部匹配对象 |
groups() | 返回一个包含全部匹配的子组的元组,若匹配失败,则返回空元组 |
其中compile()是re模块的函数,返回值为一个正则对象;group()和groups()是匹配对象的方法;其余的是正则对象的方法,这些方法大多在re模块中也有对应的函数实现,因此用户可通过“正则对象.方法”的方式或“re.函数”的方式实现。