请看下面的简单示例:如何防止jsoup转换特殊字符?
public static void main(String[] args) {
String html = "<html>\n" +
" <head></head>\n" +
" <body>\n" +
" <div> \n" +
" <p> 2 <= X </p> \n" +
" </div>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.select("p").outerHtml());
}
此打印出<p> 2 <= X </p>
但我期待着打印出所选择的HTML部分,因为它是:<p> 2 <= X </p>
。我如何告诉jsoup不要转换'<'符号?
您的输入是无效的HTML。 Jsoup对你来说是正确的。 – 2016-12-16 14:15:19
我无法控制输入。有没有办法告诉jsoup忽略html的有效性,并解析文档,因为它是为了得到输出? – RedSea