2016-04-22 67 views
-2

我已经与<img src="some value"图案下面的字符串一个HTML标记的属性值与<img正则表达式来获取

  • 开始固定
  • 将有一个单一的空间
  • 然后src=
  • 双引号中的某些字符

因此,我想获取值在上述模式中可用的双引号。我不想解析整个HTML。


<p> 
    <img src="http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg" style="width: 25%;"> 
    <img src="http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg" style="width: 25%; float: none;" class="img-thumbnail">sdklfnlkasndfknasd 
    <img src="415b4579babd4f288ae84c372cd1669e.jpg" style="width: 25%;">f 
</p> 
<p>adsffasd</p> 
<p>ff</p> 
<p><br></p> 
<p><br></p> 
<p>adsadf</p> 
<p>s</p> 

我想从唯一的img标签src属性获取所有值。 src标签可能有任何价值,这是没有必要成为一个网址。它也可以是一个文件名。 结果匹配应该是:

http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg 415b4579babd4f288ae84c372cd1669e.jpg

我试过下面的代码:

string regex = "<img src=([\"'])(?:(?=(\\\\?))\\2.)*?\\1"; 
string html = File.ReadAllText(@"data.txt"); 
var hrefmatches = Regex.Matches(html, regex); 

,其结果是:

<img src="http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg" <img src="http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg" <img src="415b4579babd4f288ae84c372cd1669e.jpg"

但我不<img src=" & "部分结果

+0

他们downvoted你,因为这可能是Stackoverflow上最常问的问题。 –

+0

我已经搜索过,但在我的场景中没有任何帮助。 –

+0

有很多陷阱尝试使用正则表达式(它也假定它是“