2016-02-13 105 views
0

我想删除一个HTML标记的结尾和另一个HTML标记的开头之间的文本。REGEX - 替换结束标记和开始标记之间的文本

页面上的标签在它们之间有不同的文本。当然,在页面上删除多个不同的块也是如此。

</h1> 
Section: ab (1)<br>Updated: 2015-05-01<br><a href="file:///home/gareththomasnz/Desktop/VirtualBoxShare/merged.html#2_index">Index</a> 
<a href="file:///man/man2html">Return to Main Contents</a><hr> 

<p> 
<a name="2_lbAB">&nbsp;</a> 
</p><h2> 

必须删除整个页面中/ H1和H2标记之间的所有内容。

尝试了几件事,但不能得到它的工作 - 任何建议?

+1

当问题得到解答时,我们不会在这里添加已解决的标题。您表示通过接受某人提供给您的答案或通过编写自己的答案(在下面提供的空白处)并接受它作为解决方案来解决问题。 –

回答

0

打开并使用一个不情愿的量词:

Search: (?s)(?<=</h1>).*?(?=<h2>) 
Replace: <blank> 

注意:我不熟悉powergrep,因此它可能使用“斜线分隔”正则表达式语法,因此:

/(?<=</h1>).*?(?=<h2>)/s 
相关问题