这里是我的字符串:删除HTML标签使用的StringTokenizer
String str = "<pre><font size="5"><strong><u>LVI . The Day of Battle</u></strong></font>
<font
size="4"><strong>";
我想删除所有的HTML标签的字符串使用StringTokenizer
。但我不明白如何在这种情况下使用StringTokenizer。因为当我使用str.replaceAll("\\<.*?>","")
时,删除所有标记效率不高,因为某些标记将位于字符串的下一行,如上面的字符串所示。但我想要在<
和>
之间的所有情况下执行此操作。我该怎么做? (我想用StringTokenizer
实现它)。谢谢..
A)你不应该使用'StringTokenizer'。正如文档所述,这是一个遗留类。B)试图用正则表达式解析HTML是徒劳的。 – 2012-03-02 23:29:38
@BrianRoach还有另外一个用于删除html标签的库JSon,但我无法使用其他库,并且似乎没有其他方法来实现它。 – El3ctr0n1c4 2012-03-02 23:32:57
为什么你不能使用其他库? – DNA 2012-03-02 23:43:28