2010-07-31 50 views
1

因此,我有一个HTML页面,它有一个窗体,并且窗体中有一排产品。使用BeautifulSoup获取表格单元格中的图像src的帮助

我已经到了现在正在循环遍历表格行的地步,并且在每个循环中我抓取所有表格单元格。

for tr in t.findAll('tr'): 
    td = tr.findAll('td') 

现在我想抓住第一个td的图像src url。

HTML如下:

<tr> 
    <td ...> 
    <a href ... > 
     <img ... src="asdf/asdf.jpg" .. > 
    </a> 
    </td> 

    ... 
</tr> 

我怎么会去这样做呢?我一直在用正则表达式思考。

我想:

td[0].a.image.src但它说,没有属性“src”中,没有工作。

回答

6

使用

td[0].a.img['src'] 

我想,你对这个问题img使用image只是一个抄写错误,但重要的一点是,在BeautifulSoup,以访问一个标签的HTML属性使用索引(例如上面代码段中的['src']),而不是点语法 - 点语法符号实际上是沿着树向下进行的(就像它在两个点之上进行的那样,每个在aimg之前)。

相关问题