2017-10-15 89 views
0

我有一个XML文件,我需要提取特征标签内部的所有文本在Python如何从XML标记值在Python

<person> 
    <text id="1"> 
    <title> 
     student 
    </title> 
    <feature> 
     xxxx 
     <name>yyyy</name> 
     zzzz 
     <country>dddd</country> 
     ffff 
    </feature> 

我的代码是这样的:

for person in tree.iter(): 
    for text in person: 
     for feature in text: 
      if feature.tag=="feature": 
       print(feature.text) 

它只显示我的“xxxx”,但我的理想的答案是 XXXX YYYY ZZZZ DDDD FFFF

+0

让XML节点包含文本内容和其他XML节点是非常不寻常的。可能为什么你有问题。 – Dijkgraaf

回答

0

当然还有一个线末(</person>)失踪。并且你应该评论你正在使用哪个库,如果有的话

如果你使用一个库把xml解析成树结构,比如说xml.etree.ElementTree,你很容易通过查询函数提取标签,属性甚至文本图书馆。您可以按照您需要的顺序进行操作,并以您需要的格式创建结果。

xml.etree.ElementTree是Python标准库的一部分。看看Python ElementTree documentation。有很多例子。