6
在我的Scala代码中,我使用getInputStream
方法HttpUrlConnection
类从服务器获取响应。响应是XML数据。但是,数据包含HTML实体,如&
和'
。从服务器收到的XML响应中的特殊字符
有没有一种方法可以用它们的文本替换这些字符,以便我可以正确解析XML?
在我的Scala代码中,我使用getInputStream
方法HttpUrlConnection
类从服务器获取响应。响应是XML数据。但是,数据包含HTML实体,如&
和'
。从服务器收到的XML响应中的特殊字符
有没有一种方法可以用它们的文本替换这些字符,以便我可以正确解析XML?
有必要将这些实体编码为xml,以免它们干扰其语法。 <
(<)和>
(>)实体使这更明显。解析其内容散布于<和>符号的XML是不可能的。
Scala的scala.xml包应该为您提供解析xml所需的工具。 Here's some guidance来自图书馆的作者。
实际上'amp'和''是XML中的预定义实体,所以你在解析包含它们的XML文件时不应该有问题。 – MarcoS 2011-05-16 13:31:49
“正确解析XML”意味着您正在使用XML解析器。 JDK自带的代码将正确处理这些序列,因此您使用哪一个? – Anon 2011-05-16 13:37:07