属性给出与minidom命名
<field name="frame.time_delta_displayed" showname="Time delta from previous displayed frame: 0.000008000 seconds" size="0" pos="0" show="0.000008000"/>
<field name="frame.time_relative" showname="Time since reference or first frame: 0.000008000 seconds" size="0" pos="0" show="0.000008000"/>
<field name="frame.number" showname="Frame Number: 2" size="0" pos="0" show="2"/>
<field name="frame.pkt_len" showname="Packet Length: 1506 bytes" hide="yes" size="0" pos="0" show="1506"/>
<field name="frame.len" showname="Frame Length: 1506 bytes" size="0" pos="0" show="1506"/>
<field name="frame.cap_len" showname="Capture Length: 1506 bytes" size="0" pos="0" show="1506"/>
<field name="frame.marked" showname="Frame is marked: False" size="0" pos="0" show="0"/>
<field name="frame.protocols" showname="Protocols in frame: eth:ip:tcp:http:data" size="0" pos="0" show="eth:ip:tcp:http:data"/>
我如何与NAME =“frame.len”现场马上不通过每一个标签迭代和检查属性查找元素?
要补充这个问题,xml是300mb。上次我尝试解析它时,内存不足。任何关于更好的萨克斯风格库的建议? – xster 2010-03-10 07:28:02
好吧,'xml.dom.minidom'是一个需要将整个文档读入内存的DOM解析器。不是因为它不够好,而是因为这是DOM解析器所做的。所以我不知道你的意思是“更好的萨克斯风格的图书馆”。 'xml.sax'是Python附带的标准SAX解析器有什么不好? – 2010-03-10 08:23:28
5000个数据包(300mb)后,试图加载xml使我的电脑崩溃。在这300MB的数据中,我只需要大约10kb分布在整个文档中。是否有一种比lxml更为高效的遍历xml的方法和比sax更简单的库? – xster 2010-03-11 04:04:43