4
我试图解析一些XML是按以下格式:LXML eTree iterparse深度
<label>
<name></name>
<sometag></sometag>
<sublabels>
<label></label>
<label></label>
</sublabel>
</label>
与此
for event, element in etree.iterparse(gzip.GzipFile(f), events=('end',), tag='label'):
if event == 'end':
name = element.xpath('name/text()')
解析它产生,因为
的空 名变量<sublabels>
<label></label>
<label></label>
</sublabel>
问题:
是否有任何方法来设置iterparse的深度或忽略子标签的标签,而不是检查它是否为空?
该文件是巨大的。一次解析洞洞事件不是一种选择。 – abruski