文本分割
re模块中提供的split()函数可使用与正则表达式模式相同的字符串分割指定文本。split()函数的语法格式如下:
split(pattern, string, maxsplit=0, flags=0)
参数的具体含义如下:
pattern:表示需要传入的正则表达式。
string:表示待匹配的目标文本。
maxsplit:用于指定分隔的次数,默认值为0,表示匹配指定模式并全部进行分割。
flasgs:表示可选标识符。
split()函数调用成功后,分割出的子项会被保存到列表中并返回。以字符串“And slowly read,and dream of the soft look”为例,split()函数的用法如下所示。
import re
words = 'And slowly read,and dream of the soft look'
result = re.split(r'\s', words) # 以“\s”分割字符串words
print(result) # 分割结果
运行代码,结果如下所示:
['And', 'slowly', 'read,and', 'dream', 'of', 'the', 'soft', 'look']
观察分割结果可知,字符串words中符合匹配模式的子项被存储到了列表之中。