外贸领航

首页展会信息 > python正则表达式详解「python正则表达式详解」

python正则表达式详解「python正则表达式详解」

来源：互联网 2023-05-23 14:04:00

Re库主要功能函数一览

re.search()——在一个字符串中搜索匹配正则表达式的第一个位置，返回match对象。

re.match()——从一个字符串的开始位置起匹配正则表达式，返回match对象。

re.findall()——搜索字符串，以列表类型返回全部能匹配的子串。

re.split()——将一个字符串按照正则表达式匹配结果进行分割，返回列表类型。

re.finditer()——搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素是match对象。

re.sub()——在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串。

Python正则表达式

Re库主要功能函数详解

re.search(pattern, string, flags=0)

在一个字符串中搜索匹配正则表达式的第一个位置，返回match对象。

pattern——正则表达式的字符串或原生字符串表示。

string——待匹配字符串。

flags——正则表达式使用时的控制标记。常用的标记有三种：

re.I/re.IGNORECASE——忽略正则表达式的大小写，[A-Z]能够匹配小写字符。

re.M/re.MULTILINE_正则表达式中的^操作符能够将给定字符串的每行当作匹配开始。

re.S/re.DOTALL——正则表达式中的.操作符能够匹配所有字符，默认匹配除换行符n之外的所有字符（无法匹配换行符n）。

import rematch = re.search(r'[1-9]d{5}', 'ABC 123456')if match: #if match语句在这里是为了判断match是否为空，避免系统报错。 print(match.group(0))<<<123456

re.match(pattern, string, flags=0)

从被匹配字符串的开始位置index=0处匹配正则表达式，返回match对象。如果index=0处匹配不能完成，则立即结束匹配，返回None。该函数里面的三个参数pattern, string, flags与re.search()函数相同。

下面例子可知，match1因为从被匹配字符串'ABC 123456'的第一个字符匹配失败后，直接结束匹配；match2则因为被匹配字符串'123456 ABC'是匹配的，因此可以成功输出。

import rematch1 = re.match(r'[1-9]d{5}', 'ABC 123456')if match1: print(match1.group(0))else: print("match1匹配不成功！")match2 = re.match(r'[1-9]d{5}', '123456 ABC')if match2: print(match2.group(0))else: print("match2匹配不成功！")<<<match1匹配不成功！123456<<<

re.findall(pattern, string, flags=0)

搜索字符串，以列表类型返回全部能匹配的子字符串。参数同上。

import rel = re.findall(r'[1-9]d{5}', 'ABC123456 TSU987654')print(l)<<<['123456', '987654']

re.split(pattern, string, maxsplit=0, flags=0)

将一个字符串按照正则表达式匹配结果进行分割，匹配的部分去掉，并作为分割点，对目标字符串string进行分割，分割出来的子字符串组成一个列表，该方法即返回这个列表。

maxsplit参数——最大分割数，剩余部分作为最后一个元素输出。当maxsplit=1时，则只匹配第一个子字符串，并将第一个子字符串作为分割点，将目标字符串string分割为两个子字符串。

其余参数同上。

re.split(r'[1-9]d{5}', 'ABC123456 TSU987654')Out[30]: ['ABC', ' TSU', '']re.split(r'[1-9]d{5}', 'ABC123456 TSU987654', maxsplit=1) #只匹配第1个子字符串"123456"，"123456"之后的剩余部分作为一个整体填进列表里。Out[31]: ['ABC', ' TSU987654']

re.finditer(patter, string, flags=0)

搜索字符串，返回一个匹配结果的迭代类型，每个迭代类型都是match对象。参数同上。

import refor m in re.finditer(r'[1-9]d{5}', 'ABC123456 TSU987654'): if m: print(m.group(0))<<<123456987654<<<

re.sub(pattern, repl, string, count=0, flags=0)

在一个字符串string中，用repl替换所有匹配正则表达式pattern的子串，返回替换后的字符串。

import rere.sub(r'[1-9]d{5}', ':zipcode', 'ABC123456 XYZ987654')Out[4]: 'ABC:zipcode XYZ:zipcode'

Re库的两种等价用法

用法一：函数式用法，一次性操作。

rst = re.search(r'[1-9'd{5}', 'ABC 123456')

方法二：面向对象用法，一次编译后可以多次操作。

pat = re.compile(r'[1-9]'d{5})rst = pat.search('ABC 123456')

regex = re.compile(patter, flags=0)函数

将正则表达式的字符串形式编译成正则表达式对象。参数的意思同上。

使用re.compile()函数以后，就可以直接使用前面的一些方法了：

regex.search()

regex.match()

regex.findall()

regex.split()

regex.finditer()

regex.sub()

上述方法的功能同Re库主要功能函数一览中的同名方法是一致的，相比后者来说，regex.search()等方法不需要里面的参数了。

To be continued.

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

python正则表达式详解「python正则表达式详解」

相关文章