2017-02-24 44 views
0

我会在前言中说我对美丽的汤相对较新。据我所知,以下行:获得属性以下类名称的美女扣

soup.find_all('div', class_ = 'favorite_links')[0] 

将得到第一个div标签的所有内容,其中class = favorite-links。然而,我真正想要的是立即在类名右侧的文本:

<div class="favorite-links" data-can-favorite="" data-id="10820653"> 
</div> 

我希望得到的是data-id之后的数字。有没有办法做到这一点?我绝对可以使用字符串操作,但我想知道是否有一种方法可以使用BeautifulSoup专门执行此操作。

对不起,我很抱歉我的术语不好。正如我之前所说,我对BeautifulSoup来说相对较新。

谢谢!

回答

1
soup.find_all('div', class_="favorite-links")[0]['data-id'] 
+0

谢谢,有没有办法将它整合到列表理解中,以便我可以在html中获取所有数据ID? – mangodreamz

+0

我尝试不工作:[t for soup.find_all(class _ ='favorite-links')[t] ['data-id']] – mangodreamz

+1

'[a ['data-id'] for a在soup.find_all('div',class _ =“favorite-links”)' – eLRuLL