2009-08-30 89 views
-1

我想分析以下类型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>用于非xml的DOM解析器

例如使用DOM解析器是2

<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root> 

我可以解析?我不会有相同的格式埃夫里的时间。我可以有不同的格式,其中标签nested.I不知道格式提前。

回答

0

您可以使用DOM解析器来处理您提供的示例 - 它们是有效的XML。但是,根据您的主题行,您将无法将其用于非XML

当你说你可以有“嵌套标签的不同格式”,你究竟是什么意思?如果它总是嵌套,例如简单

<root> 
    <tag1> 
    <tag2> 
     <tag3> 
     Stuff 
     </tag3> 
    </tag2> 
    </tag1> 
</root> 

那就没事了。做T这样,所以没有理由可以

<root> 
    <tag1> 
    <tag2> 
     Stuff 
    </tag1> <!-- Invalid --> 
    </tag2> 
</root> 
1

两个例子都是有效的XML文档:然而,XML解析器会不喜欢的标记,其中的“外部”标签前的“内部”一个封闭。

如果您的XML非常简单,特别是如果它将文本和标签组合在一起,您可能首先需要通过XSL transformation来运行它,以便更容易地解析或转换为其他格式,如HTML。