区别在于是否加?,同理在{}中也是如此
贪婪模式
{m,n}
- 对其之前的正则表达式进行 m 到 n 次匹配,在 m 和 n 之间取尽量多(贪婪方式)忽略 m 则下限默认为 0,忽略 n 则上限默认为无限次(逗号不能省 略)
import rep = re.compile(r"ab{2,4}") print(p.search("abc")) #Noneprint(p.search("abbc")) #<re.Match object; span=(0, 3), match='abb'>print(p.search("abbbc")) #<re.Match object; span=(0, 4), match='abbb'>print(p.search("abbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>print(p.search("abbbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>p = re.compile(r"ab{,4}")print(p.search("ac")) #<re.Match object; span=(0, 1), match='a'>print(p.search("abc")) #<re.Match object; span=(0, 2), match='ab'>p = re.compile(r"ab{2,}")print(p.search("abbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>print(p.search("abbbbbc")) #<re.Match object; span=(0, 6), match='abbbbb'>
非贪婪模式
*? +? ??
- " * + ? "都是贪婪的,它们对字符串进行尽可能多的匹配,有时候并不需要这种行为,可以在之后添加?,就可以以非贪婪的方式进行匹配,则尽可能少的字符将会被匹配
import rep = re.compile(r'<.*>')print(p.search('<a> b <c>')) #<re.Match object; span=(0, 9), match='<a> b <c>'>p = re.compile(r'<.*?>')print(p.search('<a> b <c>')) #<re.Match object; span=(0, 3), match='<a>'>p = re.compile(r"ab+?")print(p.search("abbbc")) #<re.Match object; span=(0, 2), match='ab'>p = re.compile(r"ab??")print(p.search("abc")) #<re.Match object; span=(0, 1), match='a'>
{m,n}?
- {m,n} 的非贪婪模式
import rep = re.compile(r"ab{2,4}?")print(p.search("abc")) #Noneprint(p.search("abbc")) #<re.Match object; span=(0, 3), match='abb'>print(p.search("abbbc")) #<re.Match object; span=(0, 3), match='abb'>print(p.search("abbbbc")) #<re.Match object; span=(0, 3), match='abb'>print(p.search("abbbbbc")) #<re.Match object; span=(0, 3), match='abb'>