学科分类
目录

文本分割

re模块中提供的split()函数可使用与正则表达式模式相同的字符串分割指定文本。split()函数的语法格式如下:

split(pattern, string, maxsplit=0, flags=0)

参数的具体含义如下:

  • pattern:表示需要传入的正则表达式。

  • string:表示待匹配的目标文本。

  • maxsplit:用于指定分隔的次数,默认值为0,表示匹配指定模式并全部进行分割。

  • flasgs:表示可选标识符。

split()函数调用成功后,分割出的子项会被保存到列表中并返回。以字符串“And slowly read,and dream of the soft look”为例,split()函数的用法如下所示。

import re
words = 'And slowly read,and dream of the soft look'
result = re.split(r'\s', words)  # 以“\s”分割字符串words
print(result)           # 分割结果

运行代码,结果如下所示:

['And', 'slowly', 'read,and', 'dream', 'of', 'the', 'soft', 'look']

观察分割结果可知,字符串words中符合匹配模式的子项被存储到了列表之中。

点击此处
隐藏目录