2016-08-17 40 views
-1

从下面的URL我需要提取img标签里面有类“所有者”的div的图像源。具有结构使用美丽的汤提取图像源

foodily.com

如下:

<div class="owner"> 
     <a href="/u/celinesteen"> 
      <img src="http://img07.foodily.net/img/50x50/6c4b366907eb.jpg"></a> 
     <div class="data"> 
      <div class="name">By 
      <a data-ftrack="{&quot;a&quot;:&quot;SU&quot;,&quot;b&quot;:&quot;SULT&quot;,&quot;c&quot;:&quot;Have Cake Will Travel&quot;}" class="_track" rel="nofollow" target="_blank" href="/u/celinesteen">Have Cake Will Travel</a> 
      </div> 
     </div> 
</div> 

我曾尝试:

soup.find('div', {"class": "owner"}).findChildren('img') 

,并返回我的整体形象,而不是标签我只是需要它里面源。

回答

1

findChildren返回一个标签数组。尝试从那些得到src属性:

images = s.find('div', {"class": "owner"}).findChildren('img') 
for img in images: 
     img.get('src') 

打印:

'http://img07.foodily.net/img/50x50/6c4b366907eb.jpg' 

检查documentation以获得更多信息。

+0

谢谢。你的和alecxe的答案都是对的。 – Simer

+0

'findChildren'回到bs2天,使用find_all http://stackoverflow.com/a/38839074/2141635 –