我有一个Python代码,它返回BBC新闻报道的标题和第一段,但目前我必须提供链接。代码如下: from lxml import html
import requests
response = requests.get('http://www.bbc.co.uk/news/business-40660355')
if (response.status_code == 200):
我在做这样的事情使用BeautifulSoup: for name in soup.find_all('div','name'):
当我使用此过滤器,我的理解是,我会得到所有的div标签与属性或类名name 。 但是,我不希望div标记的每个实例的属性为name。我想要在HTML文件的某个子树中找到它们的某些实例。更具体地说,标签<u1 class="list-box mb-3 spacer"