我正在尝试从HTML文件中过滤某些数据。例如,HTML文件如下:如何使用Python过滤来自文件的数据?
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[ ]">software_0.1-0.log</td><td align="right">17-Nov-2009 13:46 </td><td align="right">186K</td></tr>
我需要提取software_0.1-0部分以及2009年11月17日部分。我怎样才能做到这一点?
非常感谢。
从这个例子中,我们不太清楚过滤标准是什么 - 看起来它可能是''标签'之间的文本,但是这不太合适(有一个'186K'似乎并不想要)。你能再详细一点吗? – 2009-12-12 21:17:09