我需要解析HTML文件并提取NeedThis *用C#字符串/净,示例代码:正则表达式找到html标签内容
<tr class="class">
<td style="width: 120px">
<a href="NeedThis1">NeedThis2</a>
</td>
<td style="width: 120px">
<a href="NeedThis3">
NeedThis4</a>
</td>
<td style="width: 30%">
NeedThis5
</td>
<td>
NeedThis6
</td>
<td style="width: 120px">
NeedThis7
</td>
</tr>
我知道一个HTML解析器应该是更好地在这里,但我需要的是提取这些文本,这只是一个临时帮手工具...
任何人都可以帮助我这个?
谢谢!
我想引用这个问题的第一个答案:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Soravux 2010-10-03 04:12:14
我已经看到我只是不想使用IndexOf ...正如我所说,这是一个临时帮手工具,而不是最终产品...我需要从大约50k文件中提取这些字符串,这些文件存储在我的本地硬盘和在数据库中插入,一旦完成,按Ctrl +删除工具=) – 2010-10-03 04:14:16
@Soravux:我们认为都一样 - 我正要这样做,然后我看到:-) – Cameron 2010-10-03 04:14:39