-1
您好,我正在尝试从以下网站获取公司链接https://www.unpri.org/directory/。然而,我的代码不断返回None而不是href,这里是我的代码。我试着在这里寻找,但似乎无法找到其他人有同样的问题。.get('href')返回None而不是href
这里是我的orignial代码
from splinter import Browser
import bs4 as bs
import os
import time
import csv
url = 'https://www.unpri.org/directory/'
path = os.getcwd() + "/chromedriver"
executable_path = {'executable_path': path}
browser = Browser('chrome', **executable_path)
browser.visit(url)
source = browser.html
soup = bs.BeautifulSoup(source,'lxml')
for url in soup.find_all('div',class_="col-xs-8 col-md-9"):
print(url.get('href', None))
嗯,你会发现'div's ...你不想找到'a'标签来获取他们的**'href's吗? –
你正在选择'div'元素('soup.find_all('div',class _ =“col-xs-8 col-md-9”)'),他们通常没有'href'属性... – errata
只有大约9家公司在该页面上。网站上的哪个页面是您真正感兴趣的页面? –