什么正则表达式可以匹配表格单元格中的可识别文本的嵌套表格?我试过了,但没有拿出一个正则表达式来提取特定的表,我希望在示例中抓取两个表的开始和结束。下面是一些上手:“<table>.*?</table>
”什么正则表达式可以匹配表格单元格中可识别文本的嵌套表格?
<table>
<tr>
<td>
<table>
<tr><td>Code1</td></tr>
<tr><td>some data</td></tr>
<tr><td>etc ...</td></tr>
</table>
</td>
</tr>
<tr>
<td>
<table>
<tr><td>Code2</td></tr>
<tr><td>some data</td></tr>
<tr><td>etc ...</td></tr>
</table>
</td>
</tr>
</table>
说我想提取含“代码2”的表格。什么正则表达式将专门匹配,只有那张表?
请考虑使用HTML解析器/ DOM。一般来说,使用正则表达式解析HTML并不被认为是最佳实践。有解析器可用于PHP,.NET等(不知道你使用的是什么语言)。 – TrueWill 2009-10-01 17:24:12
[可以提供一些为什么很难用正则表达式解析XML和HTML的例子吗?](http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-为什么它很难解析xml和html-with-a-rege) – 2011-07-09 21:00:23
[RegEx match open tags not except XHTML self-contained tags](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) – 2011-09-15 14:10:21