2011-08-23 85 views
3

我正在使用ConstructingParser将XML数据解析到scala.xml.Node中。我注意到在一个XML片段上,如scala.xml.parsing.ConstructingParser拆分文本内容

<foo> bar & lt;巴兹< /富>

根ELEM不具有一个单独的文本子方含“栏< baz”的,而是有三个独立的文本子节点,一个包含“栏”,一种含“<”和一个含有“巴兹”。这打破了文件的后续处理。当然,我可以自己合并文本元素,但我很好奇是否有办法让ConstructingParser为我做这件事。

Gr。西尔维奥

回答

0

斯卡拉是不是我的,但我敢肯定答案是“不”。绝对不能保证一个元素的文本内容会在解析为单个文本节点后出现。在这种情况下,有文本,实体引用以及更多文本,所以结果可能不是那么令人惊讶,以至于有三个文本节点,但无论如何也不能保证。