python正则表达式详解「python正则表达式详解」
Re库主要功能函数一览
re.search()——在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象。
re.match()——从一个字符串的开始位置起匹配正则表达式,返回match对象。
re.findall()——搜索字符串,以列表类型返回全部能匹配的子串。
re.split()——将一个字符串按照正则表达式匹配结果进行分割,返回列表类型。
re.finditer()——搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象。
re.sub()——在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串。
Python正则表达式
Re库主要功能函数详解
re.search(pattern, string, flags=0)
在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象。
pattern——正则表达式的字符串或原生字符串表示。
string——待匹配字符串。
flags——正则表达式使用时的控制标记。常用的标记有三种:
re.I/re.IGNORECASE——忽略正则表达式的大小写,[A-Z]能够匹配小写字符。
re.M/re.MULTILINE_正则表达式中的^操作符能够将给定字符串的每行当作匹配开始。
re.S/re.DOTALL——正则表达式中的.操作符能够匹配所有字符,默认匹配除换行符n之外的所有字符(无法匹配换行符n)。
import rematch = re.search(r'[1-9]d{5}', 'ABC 123456')if match: #if match语句在这里是为了判断match是否为空,避免系统报错。 print(match.group(0))<<<123456
re.match(pattern, string, flags=0)
从被匹配字符串的开始位置index=0处匹配正则表达式,返回match对象。如果index=0处匹配不能完成,则立即结束匹配,返回None。该函数里面的三个参数pattern, string, flags与re.search()函数相同。
下面例子可知,match1因为从被匹配字符串'ABC 123456'的第一个字符匹配失败后,直接结束匹配;match2则因为被匹配字符串'123456 ABC'是匹配的,因此可以成功输出。
import rematch1 = re.match(r'[1-9]d{5}', 'ABC 123456')if match1: print(match1.group(0))else: print("match1匹配不成功!")match2 = re.match(r'[1-9]d{5}', '123456 ABC')if match2: print(match2.group(0))else: print("match2匹配不成功!")<<<match1匹配不成功!123456<<<
re.findall(pattern, string, flags=0)
搜索字符串,以列表类型返回全部能匹配的子字符串。参数同上。
import rel = re.findall(r'[1-9]d{5}', 'ABC123456 TSU987654')print(l)<<<['123456', '987654']
re.split(pattern, string, maxsplit=0, flags=0)
将一个字符串按照正则表达式匹配结果进行分割,匹配的部分去掉,并作为分割点,对目标字符串string进行分割,分割出来的子字符串组成一个列表,该方法即返回这个列表。
maxsplit参数——最大分割数,剩余部分作为最后一个元素输出。当maxsplit=1时,则只匹配第一个子字符串,并将第一个子字符串作为分割点,将目标字符串string分割为两个子字符串。
其余参数同上。
re.split(r'[1-9]d{5}', 'ABC123456 TSU987654')Out[30]: ['ABC', ' TSU', '']re.split(r'[1-9]d{5}', 'ABC123456 TSU987654', maxsplit=1) #只匹配第1个子字符串"123456","123456"之后的剩余部分作为一个整体填进列表里。Out[31]: ['ABC', ' TSU987654']
re.finditer(patter, string, flags=0)
搜索字符串,返回一个匹配结果的迭代类型,每个迭代类型都是match对象。参数同上。
import refor m in re.finditer(r'[1-9]d{5}', 'ABC123456 TSU987654'): if m: print(m.group(0))<<<123456987654<<<
re.sub(pattern, repl, string, count=0, flags=0)
在一个字符串string中,用repl替换所有匹配正则表达式pattern的子串,返回替换后的字符串。
import rere.sub(r'[1-9]d{5}', ':zipcode', 'ABC123456 XYZ987654')Out[4]: 'ABC:zipcode XYZ:zipcode'
Re库的两种等价用法
用法一:函数式用法,一次性操作。
rst = re.search(r'[1-9'd{5}', 'ABC 123456')
方法二:面向对象用法,一次编译后可以多次操作。
pat = re.compile(r'[1-9]'d{5})rst = pat.search('ABC 123456')
regex = re.compile(patter, flags=0)函数
将正则表达式的字符串形式编译成正则表达式对象。参数的意思同上。
使用re.compile()函数以后,就可以直接使用前面的一些方法了:
regex.search()
regex.match()
regex.findall()
regex.split()
regex.finditer()
regex.sub()
上述方法的功能同Re库主要功能函数一览中的同名方法是一致的,相比后者来说,regex.search()等方法不需要里面的参数了。
To be continued.
相关文章
- 福建省市场监督管理局:1批次罐头不合格「不合格童鞋品牌」
- 大连跨境电子商务「服务外包产业转型升级」
- 互联网公司薪酬对比「互联网行业薪资」
- 铜陵警方抓获12名涉赌人员「铜陵大案」
- 2016年江苏省跨境电商交易额「铜陵CPI」
- 安徽最近抓获的赌博案「跨境赌球团伙被端安徽警方抓获31人」
- 宝鸡首个跨境电商监管中心通过宝鸡海关预验收了吗「跨境电商海关」
- 开店股权分配方案「员工入股分红怎么算」
- 直销事业三大关到底是谁给你的直销事业设限了「直销的核心是什么」
- 分销商城是什么模式「易链分销」
- 银川跨境电商综合试验区「银川大阅城有什么玩的」
- 小学英语不规则动词表大全「英语常用不规则动词表完整版」
- oovv创始人「oolmia加拿大」
- 黑河市跨境电商「黑河自由贸易区」
- 福特汽车宣布调整组织架构,全球将削减7000个职位「新能源汽车裁员」
- ABC童装广告「ABC童装童鞋广告」
- mtv颁奖典礼2021「2021劲歌金曲颁奖典礼」
- 维密总部裁员50人,多位高层离职「维密员工」