我在html敏捷包的帮助下解析了html文件中的表格信息。如何在HTML敏捷包的帮助下从html文件中提取最内层的表格?
现在我可以做到这一点,它的工作原理。
但是,当我要提取的表格最内层。
或者我不知道它在嵌套表中的哪个位置。并且可以有任意数量的嵌套表,并且我希望提取具有列名称,地址的表的信息。
Ex。
<table>
<table>
<tr><td>PHONE NO.</td><td>OTHER INFO.</td></tr>
<tr><td>
<table>
<tr><td>AMOUNT</td></tr>
<tr><td>50000</td></tr>
<tr><td>80000</td></tr>
</table>
</td></tr>
<tr><td>
<table>
<tr><td>
<table>
<tr><td>
<table>
<tr><td> NAME </td><td>ADDRESS</td>
<tr><td> ABC </td><td> kfks </td>
<tr><td> BCD </td><td> fdsa </td>
</table>
</tr></td>
</table>
</td></tr>
</table>
</td></tr>
</table>
有很多表,但我想提取具有列名称,地址的表。 那我该怎么办?
@康斯坦丁,你好..但是如果列位置不固定,那么我应该怎么做才能在哪个位置列名称“NAME”? – Harikrishna 2010-03-31 05:12:19
@康斯坦丁,就像它会返回可能位于特定表的嵌套表中的任何位置的表,并且具有列标题名称和电话号码? – Harikrishna 2010-03-31 05:22:07
@Konstantin这是稍微好一点:'td [normalize-space()='ADDRESS']' – 2010-03-31 05:31:18