我试图用BeautifulSoup解析HTML类和href标记。解析HTML标签,基于使用美丽的汤
我想要的内容是这样的:
<a class="yil-biz-ttl" id="yil_biz_ttl-2" href="http://some-web-url/" title="some title">Title</a>
我想,得到了以下错误:
maxx = soup.findAll("href", {"class: "yil-biz-ttl"})
------------------------------------------------------------
File "<ipython console>", line 1
maxx = soup.findAll("href", {"class: "yil-biz-ttl"})
^
SyntaxError: invalid syntax
我想是字符串:http://some-web-url/
如果有超过10个这样的链接,那么您只提取第一个权限? – whatf
我修改了我的答案,以显示如何在页面中找到所有此类链接。 – infrared
有可能是'''没有'href'属性的元素,如本页上的向上箭头。 – jfs