我试图解析来自伪XML格式的文件中的文本。我可以得到一个DOM文档的它时,它有如下结构:解析Java中的伪XML文件
<product>
<product_id>234567</product_id>
<description>abc</description>
</product>
当结构类似于下面我快到的问题发生:
<product>
<product_id>234567</product_id>
<description>abc</description>
<quantity 1:2>
<version>1.1</version>
</quantity 1:2>
<version>1.2</version>
<quantity 2:2>
</quantity 2:2>
</product>
它产生由于空间下面的例外<quantity 1:2>
:
org.xml.sax.SAXParseException:[Fatal Error] :1:167: Element type " quantity " must be followed by either attribute specifications, ">" or "/>"
我可以用下划线替换空间解决这个问题。问题是结构的大小可能有所不同,并且包含几个具有相同格式的子节点(<node 1:x>
),并且该文件可以包含数百个要解析的结构。有没有可用的类来解析这样的文本返回一个树状对象?
我创建了一个类来将该文件预处理为有效的XML。 – Mane 2012-03-07 22:59:12