1
我有一个HTML页面(seed)
形式的提取物对(HREF,ALT):如何王氏蟒蛇scrapy
<div class="sth1">
<table cellspacing="6" width="600">
<tr>
<td>
<a href="link1"><img alt="alt1" border="0" height="22" src="img1" width="92"></a>
</td>
<td>
<a href="link1">name1</a>
</td>
<td>
<a href="link2"><img alt="alt2" border="0" height="22" src="img2" width="92"></a>
</td>
<td>
<a href="link2">name2</a>
</td>
</tr>
</table>
</div>
我想什么做的是循环到所有<tr>
的,并提取所有href, alt
与python scrapy配对。在这个例子中,我应该得到:
link1, alt1
link2, alt2