2010-07-28 26 views
0

我有以下文字我想捕捉没有任何东西或空间在他们的h4标题标签?

obart on 18 September 1905. <h4>(^)</h4>Always known as Jack, he had been in the islands arrived in Rabaul on SS <h4> </h4><i> Montoro</i> to begin a caver, and d="k987" /><a id="k988" /><a id="k989" /><a id="k990" /></p><h4 style="text-align:left;">URGENT – TERRITORY OF NEW GUINEA</h4><br /><div class="quotation">In view of the broadcast that proceed with all speed to Kieta, bringing clothing and bedding. Rations will be provided. <br /></div><div clas:black;size:1px" /><h4 style="text-align:left;"></h4></div></body></html><h4></h4> 

它笛H4标题我想捕捉那些一无所有的他们或在他们的空间,任何人可以帮助我在这? 我已经试过这种但是

(<h4.*?>)([^a-zA-Z0-9]+?)</h4> 

但它不看工作

回答

1

虽然我eykanal同意,更好的解决办法是有的为DOM的,一个正则表达式匹配与他们没有或只有空格标签应该是那样简单......

<h4.*?>\\s*?</h4> 

NB。我不熟悉在C#中编写正则表达式模式,但我认为这应该是正确的。

相关问题