我想使用Python脚本从HTML表格中提取数据,并将其作为变量保存(如果它们存在后,我可以在相同的脚本中使用它们)到一个单独的文件中。另外我希望脚本忽略表格的第一行(组件,状态,时间/错误)。我宁愿不使用外部库。使用Python从HTML表格中提取数据
输出到一个新文件应该像这样:
SAVE_DOCUMENT_STATUS = "OK"
SAVE_DOCUMENT_TIME = "0.408"
GET_DOCUMENT_STATUS = "OK"
GET_DOCUMENT_TIME = "0.361"
...
而且继承人的输入脚本:
<table border=1>
<tr>
<td><b>Component</b></td>
<td><b>Status</b></td>
<td><b>Time/Error</b></td>
</tr>
<tr><td>SAVE_DOCUMENT</td><td>OK</td><td>0.408 s</td></tr>
<tr><td>GET_DOCUMENT</td><td>OK</td><td>0.361 s</td></tr>
<tr><td>DVK_SEND</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>DVK_RECEIVE</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>GET_USER_INFO</td><td>OK</td><td>0.135 s</td></tr>
<tr><td>NOTIFICATIONS</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>ERROR_LOG</td><td>OK</td><td>0.001 s</td></tr>
<tr><td>SUMMARY_STATUS</td><td>OK</td><td>0.913 s</td></tr>
</table>
我试图做到这一点在bash,但因为我需要将* _TIME变量与最大时间进行比较,然后失败,因为它们是浮点数。
“还有一两件事,我不想使用外部库”。史诗失败。你真的必须使用美丽的汤。这是最好的这种事情。 –
好吧,如果没有其他出路,我会用美丽的汤:) – Marko
“从HTML”是美丽的汤的代名词。 – SingleNegationElimination