我正在使用RegEx清理包含HTML的XML文件。正确匹配两个单词之间的正则表达式并获取所有匹配结果

某些文件包含多个style -elements，我想将它们全部和中间的内容删除。例如：

&lt;STYLE&gt; 
    group 1 
&lt;/STYLE&gt; 
    Random text here which shall not be removed. 
&lt;STYLE&gt; 
    group 2 
&lt;/STYLE&gt; 
    Some more random text here which shall not be removed. 
&lt;STYLE&gt; 
    group 3 
&lt;/STYLE&gt;

我使用下面的正则表达式与/ s参数

(&lt;STYLE&gt;).*(&lt;\/STYLE&gt;)

问题是，这个正则表达式匹配<style>（#1）和最后</style>之间的一切（#3 ）。

我想只匹配group,<style>和</style>元素。这如何实现？

来源

2017-05-08 Sha

您已接受的解决办法，但一定要明白，只有将删除第一个样式和组，即。您不能使用它来设置第二个（使用当前格式） – grail

@grail - 使用/ sg标志时，接受的解决方案实际上可以正确地执行工作。 – Sha

你可以尝试使用?操作使得正则非贪婪：

(&lt;STYLE&gt;).*?(&lt;\/STYLE&gt;) 
       ^^^ use ? to tell the regex engine to stop at the first closing tag

演示在这里：

Regex101

来源

2017-05-08 04:15:58

太简单了！谢谢：） – Sha

正确匹配两个单词之间的正则表达式并获取所有匹配结果

回答

Regex101

相关问题