1
我需要从XML文件中提取某些数据,但也知道提取的元素在原始XML文件中的位置 - 作为从文件开始的字符偏移量,或该行中的行号+位置。python中的XML解析,同时保留链接到原始文件中的位置
常用的python XML库似乎没有提供任何这样的功能。
有一个类似的问题Obtaining position info when parsing HTML in Python这是通过编写一个自定义的包装器解决html5lib;但该库不适用于我,因为特定的数据不是HTML。
是否有任何保存元素位置信息的XML解析器,还是我必须为此自动解析?
lxml有'sourceline',但只给你行号 – gsnedders