我在从XML树中检索信息时遇到问题。Python和libxml2:如何使用XPATH在XML节点中迭代
我的XML具有这种形状:
<?xml version="1.0"?>
<records xmlns="http://www.mysyte.com/foo">
<record>
<id>first</id>
<name>john</name>
<papers>
<paper>john_1</paper>
<paper>john_2</paper>
</papers>
</record>
<record>
<id>second</id>
<name>mike</name>
<papers>
<paper>mike_a</paper>
<paper>mike_b</paper>
</papers>
</record>
<record>
<id>third</id>
<name>albert</name>
<papers>
<paper>paper of al</paper>
<paper>other paper</paper>
</papers>
</record>
</records>
我想要做的是萃取,如后续数据的元组:
[{'code': 'first', 'name': 'john'},
{'code': 'second', 'name': 'mike'},
{'code': 'third', 'name': 'albert'}]
现在,我写了这个Python代码:
try:
doc = libxml2.parseDoc(xml)
except (libxml2.parserError, TypeError):
print "Problems loading XML"
ctxt = doc.xpathNewContext()
ctxt.xpathRegisterNs("pre", "http://www.mysyte.com/foo")
record_nodes = ctxt.xpathEval('/pre:records/pre:record')
for record_node in record_nodes:
id = record_node.xpathEval('id')[0].content
name = record_node.xpathEval('name')[0].content
ret_list.append({'code': id, 'name': name})
我的问题是,我没有任何结果,我的印象是我做错了XPATH w如果我在节点上迭代。
我也试图与这些XPath的ID和名称:
/id
/name
/record/id
/record/name
/pre:id
/pre:name
等,但任何结果(顺便说一句,如果我使用前缀的子查询我有一个错误)。
有什么想法?
对此没有评论?这确实是一种“直接在libxml2中执行”的方法。 – mzjn 2010-08-11 17:59:07
对不起!我忘了签署这个答案作为最好的答案!它实际上以我想要的方式工作。谢谢! – 2010-10-19 14:52:42