-1
我想提取一个xml文件中的所有标签。但是,我无法编写适当的正则表达式来提取我想要的内容。如何编写正则表达式来提取标签?
该文件中的标签格式是这样的:
Tags=<"tracffic""apple""sample">
而且我想返回一个列表包含了所有的标签:交通,苹果,样品]
我尝试这样做:
Tags=<("[\w]+")+
哪些只返回最后一个标签。
任何人都可以帮我一把吗?
我想提取一个xml文件中的所有标签。但是,我无法编写适当的正则表达式来提取我想要的内容。如何编写正则表达式来提取标签?
该文件中的标签格式是这样的:
Tags=<"tracffic""apple""sample">
而且我想返回一个列表包含了所有的标签:交通,苹果,样品]
我尝试这样做:
Tags=<("[\w]+")+
哪些只返回最后一个标签。
任何人都可以帮我一把吗?
试试这个:
m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">')
tags = [x for x in m.group(1).split('"') if x]
现在tags
包含:
['traffic', 'apple', 'sample']
谢谢。我没有想到匹配后拆分整个字符串的方式。 :) – AnneS
你确定这是XML?你可以发布样本吗? – FailedDev