2011-11-29 56 views
-1

我想提取一个xml文件中的所有标签。但是,我无法编写适当的正则表达式来提取我想要的内容。如何编写正则表达式来提取标签?

该文件中的标签格式是这样的:

Tags=<"tracffic""apple""sample"> 

而且我想返回一个列表包含了所有的标签:交通,苹果,样品]

我尝试这样做:

Tags=<("[\w]+")+ 

哪些只返回最后一个标签。

任何人都可以帮我一把吗?

+3

你确定这是XML?你可以发布样本吗? – FailedDev

回答

1

试试这个:

m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">') 
tags = [x for x in m.group(1).split('"') if x] 

现在tags包含:

['traffic', 'apple', 'sample'] 
+0

谢谢。我没有想到匹配后拆分整个字符串的方式。 :) – AnneS