我难倒。我编写Python 3.6.2,使用PyCharm作为我的IDE。下面的脚本片段展示了我的问题:Python的应用re.sub行为不同于re.findall
def dosubst(m):
return m.group() + "X"
line = r"set @message = formatmessage('%s %s', @arg1, @arg2);"
m = re.findall(r"@\w+\b", line, re.IGNORECASE)
print(m[0]) # prints "@message"
print(m[1]) # prints "@arg1"
print(m[2]) # prints "@arg2"
foo = re.sub(r"@\w+\b", dosubst, line, re.IGNORECASE)
print(foo) # prints "set @messageX = formatmessage('%s %s', @arg1X, @arg2);"
你可以看到,re.findall
发现的三场比赛。然而,re.sub
仅调用dosubst
功能两次。如果我改变@message
到message
然后re.sub
仍称dosubst
两次,但拿起@arg1
和@arg2
。百思不得其解。我想这可能是贪婪与posessive等,但 - 改变@message
到message
和产生的行为否定这一点。谁能解释一下?我正在尝试对SQL进行一些基本的文本解析,以重构大量文件的消息格式。我使用regexr.com为我制作的大部分正则表达式原型创建了原型,并且还发现了该行中的三个模式。谢谢。