忽略XML标记之间的文本

""" test.xml 

<xyz> 
     <pqr> 
     <abc><a href="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwvYT4=</abc> 
     </pqr> 
     <pqr> 
     <abc><iframe src="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwv</abc> 
     </pqr> 
<xyz> 

""""

当我使用这个XML文件并在python中解析时，它显示错误（不正确）。我怎样才能解析这个XML文件或任何其他方法从这个文件中获取数据。忽略XML标记之间的文本

来源

2011-04-20 Arjun Jain

您应该在每行之前放置四个空格来格式化代码。您也可以选择它并单击“{}”按钮。在[Markdown编辑帮助]（http://stackoverflow.com/editing-help）页面提供更多有用的提示。 – 2011-04-20 09:36:50

您可以先修改XML和使用CDATA来封装格式不正确的XML

例如：

<xyz> 
     <pqr> 
     <abc><![CDATA[<a href="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwvYT4=]]></abc> 
     </pqr> 
     <pqr> 
     <abc><![CDATA[<iframe src="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwv]]></abc> 
     </pqr> 
<xyz>

见：http://www.w3schools.com/xml/xml_cdata.asp

这个你可以使用Python中的XML解析器

后

来源

2011-04-20 09:39:42

现在它的作品谢谢szymon – 2011-04-20 09:50:48