我使用这个模式删除所有的HTML标签(Java代码):如何让HTML标签中指定
String html="text <a href=#>link</a> <b>b</b> pic<img src=#>";
html=html.replaceAll("\\<.*?\\>", "");
System.out.println(html);
现在,我想保持标签<a ...>
(与</a>
)和标签<img ...>
我想要的结果是:
text <a href=#>link</a> b pic<img src=#>
如何做到这一点?
我不需要HTML解析器要做到这一点,
,因为我需要这个正则表达式来筛选大量的HTML代码片段,
所以,我想用正则表达式
解决方案
这可能是跑题了,但你有HTML的例子是无效的 - 你也可以看到从事实上它把SO的语法高亮显示出来...... – teukkam 2010-09-24 09:25:03
它们完全有效。 HTML不需要引用属性值,也不需要作者关闭'img'标签(等等)。 – 2010-09-24 09:33:30