如何用“”替换我从HTML文件中解析的 
字符? 有关于该像许多问题,并“接受”的答案,java - 将字符串处理为
How to remove with Jsoup?
How to remove " " from java string
Handling special entities like & nbsp; , & pound; in HtmlCleaner
但我仍然无法通过使用这些给出的所有解决方案,通过此获得链接,
if(tr.text().replace("\u00a0", "").isEmpty()){
System.out.println("testing---");
}
我在做什么错在这里? 在这种情况下可以使用jsoup吗?我在其中一个答案中读到了这一点。
UPDATE 这是我试图从中获取数据的HTML部分。
<TR>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boBL noWrap> </TD>
<TD class=xl27boL noWrap align=right> </TD>
</TR>
我已更新问题 – 2014-08-31 09:46:11
你是说noWrop thingy导致问题? – 2014-08-31 09:59:29
不,实际上,JSoup真的可以容忍无效的HTML - 这是它的伟大之处之一。 – 2014-08-31 10:01:02