我目前正在解析XML文档(添加元素,添加属性等)。所以我在开始处理之前首先需要解析XML。但是,lxml
似乎正在删除元素<?xml ...>
。例如lxml在解析时是否删除<?xml ...>标签?
from lxml import etree
tree = etree.fromstring('<?xml version="1.0" encoding="utf-8"?><dmodule>test</dmodule>', etree.XMLParser())
print etree.tostring(tree)
将导致
<dmodule>test</dmodule>
有谁知道为什么<?xml ...>
元素被删除?我认为编码标签是有效的XML。谢谢你的时间。
谢谢,这是我正在寻找的。此外,我不得不添加 'etree.tostring(tree,xml_declaration = True,encoding =“utf-8”)' 以获得我想要的编码 – axsuul 2010-07-12 21:19:43
@Axsuul:utf-8是默认编码 – 2010-07-12 21:39:59