我试图解析HTML类似如下:如何使用美丽的汤4找到属性
<tbody>
<tr class data-row="0">
<td align="right"></td>
</tr>
<tr class data-row="1">
<td align="right"></td>
</tr>
<tr class="thead over_theader" data-row="2">
<td align="right"></td>
</tr>
<tr class="thead" data-row="3">
<td align="right"></td>
</tr>
<tr class data-row="4">
<td align="right"></td>
</tr>
<tr class data-row="5">
<td align="right"></td>
</tr>
</tbody>
我想获得的所有tr
标签(和他们的孩子)在未指定class
的。对于上面的示例,这意味着我需要tr
标签,其中data-row
不是2或3.
如何使用美丽汤4做到这一点?
我试图
tableBody = soup.findAll('tbody')
rows = tableBody[0].findAll(attrs={"class":""})
但这返回长度为8的类型bs4.element.ResultSet
(即它包括tr
孩子td
标记)时,我想长度为4的bs4.element.ResultSet
(每个tr
标签与class = ""
) 。