用JSOUP(非正则表达式)删除只有html标签(保留所有定制/未知标签)的正确方法是什么?Jsoup只删除html标签
预期输入:
<html>
<customTag>
<div> dsgfdgdgf </div>
</customTag>
<123456789/>
<123>
<html123/>
</html>
预期输出:
<customTag>
dsgfdgdgf
</customTag>
<123456789/>
<123>
<html123/>
我试图用WhiteList.none()清洁使用,但它还会删除自定义标记。
我也试过:
String str = Jsoup.parse(html).text()
但它还会删除自定义标记。
这个answer对我不好,因为自定义标签的数量是无限的。
没有完整的配方,但你可能要检查消毒 – Marged