我解析一些html代码,我试图用它的src值(不带后缀)替换img中的alt当且仅当alt是空的。如果符合条件,则用另一个正则表达式替换正则表达式的选择
例子:
输入:
... some HTML here ....
<img src="my_image.jpg" alt="something_is_already_here" width="450" height="300">
... some HTML here ....
<img src="my_image2.jpg" alt="" width="450" height="300"
输出:
... some HTML here ....
<img src="my_image.jpg" alt="something_is_already_here" width="450" height="300">
... some HTML here ....
<img src="my_image2.jpg" alt="my_image2" width="450" height="300">
我已经写了src和中高音的正则表达式,但不知道如何使用它做我真正需要的东西。
//src=\"([^"]*)\.jpg\"
string srcPattern = "src=\\\"([^\"]*)\\.jpg\\\"";
//alt=\"([^"]*)\"
string altPattern = "alt=\\\"([^\"]*)\\\"";
Regex rSrc = new Regex(srcPattern);
Regex rAlt = new Regex(altPattern);
什么'img'标签应该受到影响(第一个是不是,为什么只有第二个是) ?你为什么依赖于正则表达式来进行HTML解析?使用HtmlAgilityPack或任何其他HTML解析器。 –
@stribizhev第一个不受影响导致alt的值不为空。 – Dracke