2011-05-16 91 views
6

在我的Scala代码中,我使用getInputStream方法HttpUrlConnection类从服务器获取响应。响应是XML数据。但是,数据包含HTML实体,如&'从服务器收到的XML响应中的特殊字符

有没有一种方法可以用它们的文本替换这些字符,以便我可以正确解析XML?

+4

实际上'amp'和''是XML中的预定义实体,所以你在解析包含它们的XML文件时不应该有问题。 – MarcoS 2011-05-16 13:31:49

+2

“正确解析XML”意味着您正在使用XML解析器。 JDK自带的代码将正确处理这些序列,因此您使用哪一个? – Anon 2011-05-16 13:37:07

回答

3

有必要将这些实体编码为xml,以免它们干扰其语法。 &lt;(<)和&gt;(>)实体使这更明显。解析其内容散布于<和>符号的XML是不可能的。

Scala的scala.xml包应该为您提供解析xml所需的工具。 Here's some guidance来自图书馆的作者。