2016-08-23 28 views
1

我刮的用户名和所有的人都在同一个标​​签和他们的HREF中都开始一样的,就像这样:如何使用BeautifulSoup从具有特定开始的标签只获取字符串?

<a href="http://lolprofile.net/summoner/eune/Sadastyczny" class="link5">Sadastyczny</a> 

我试图发现,只有当他们拥有一流的link5但也有其他的值是有我不想刮的那个课。那么,有没有一种方法来搜索所有这些都是

href="http://lolprofile.net/summoner" 
在他们

但不能休息,因为这显然是为每一个用户名不同的标签?

+0

'links = [i for soup.find_all('a')if i.attrs.get('class')=='link5']' – n1c9

回答

1

BeautifulSoup documentation

使用正则表达式可以匹配网站。如果你从来没有听说过的正则表达式,你可以使用这个:

soup.find_all(href=re.compile("http://lolprofile.net/summoner/*"))

不要忘了导入re -module!

+0

正是我需要的,我会研究一下模块,非常感谢! – edsheeran

相关问题