-2
我已经与<img src="some value"
图案下面的字符串一个HTML标记的属性值与<img
即正则表达式来获取
- 开始固定
- 将有一个单一的空间
- 然后
src=
- 双引号中的某些字符
因此,我想获取值在上述模式中可用的双引号。我不想解析整个HTML。
<p>
<img src="http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg" style="width: 25%;">
<img src="http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg" style="width: 25%; float: none;" class="img-thumbnail">sdklfnlkasndfknasd
<img src="415b4579babd4f288ae84c372cd1669e.jpg" style="width: 25%;">f
</p>
<p>adsffasd</p>
<p>ff</p>
<p><br></p>
<p><br></p>
<p>adsadf</p>
<p>s</p>
我想从唯一的img标签src
属性获取所有值。 src
标签可能有任何价值,这是没有必要成为一个网址。它也可以是一个文件名。 结果匹配应该是:
http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg
http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg
415b4579babd4f288ae84c372cd1669e.jpg
我试过下面的代码:
string regex = "<img src=([\"'])(?:(?=(\\\\?))\\2.)*?\\1";
string html = File.ReadAllText(@"data.txt");
var hrefmatches = Regex.Matches(html, regex);
,其结果是:
<img src="http://www.nkb.com/Images/598e97fa05454766902650b4c01d7645.jpg"
<img src="http://www.nkb.com/Images/1ec31c56d06040489e9832f98852d8ce.jpg"
<img src="415b4579babd4f288ae84c372cd1669e.jpg"
但我不<img src="
& "
部分结果
他们downvoted你,因为这可能是Stackoverflow上最常问的问题。 –
我已经搜索过,但在我的场景中没有任何帮助。 –
有很多陷阱尝试使用正则表达式(它也假定它是“