我有一个很大的HTML文件填充东西。REGEX - 去除东西周围的东西?
某处在该文件中,有这样
<span class="xcomponent">pls do not delete me</span>
我需要摆脱的东西,但留下的是介于两者之间的线路。
我正在使用Java,并且我假设正确的方法是正则表达式 - 我只是没有足够的正则表达式经验来完成这一步。
如果有任何帮助,这是我的'在黑暗中刺'。
.*?(<span class="xcomponent">.*?</span>).*?
谢谢。顺便说一句,在这种情况下,$ 1意味着什么? – guywhoneedsahand
@guywhoneedsahand,'$ 1'匹配第一个捕获组(在父项中)。用'(。*?)'匹配的东西' –
好的。多谢你们! – guywhoneedsahand