美丽的汤解析标签不一致的HREF

我知道，它可以提取所有的一个标签一个HTML页面：美丽的汤解析标签不一致的HREF

mydivs = soup.findAll("a")

但如果我只是想有这种格式的标签：

<a href="/experiments/ENCSR7EADCH/"> 
<a href="/experiments/ENCSR77RTSA/"> 
<a href="/experiments/ENCSR75YUDJ/"> 
<a href="/experiments/ENCSR779CZG/">

我想：

mydivs = soup.findAll("a", { "href" : "/experiments/ENCSR*" })

但这返回一个空列表....

任何提示？

来源

2017-01-23 which_command

regular expression

import re 
mydivs = soup.findAll("a", href=re.compile(r"/experiments/ENCSR"))

CSS Selector：

mydivs = soup.select('a[href^="/experiments/ENCSR"]')

来源

2017-01-24 02:20:52

美丽的汤解析标签不一致的HREF

回答

相关问题