所以我想使用BeautifulSoup和Python第一次做网页抓取。我试图刮掉页面是:http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172为什么我没有获得领域的价值而不是领域本身?
client = request('http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172')
page_html = client.read()
client.close()
page_soup = soup(page_html)
identification = page_soup.find('div', {'data-bind':'text: name'})
print(identification.text)
当我这样做,我只是得到一个空字符串。如果我打印出简单的标识变量,我得到:
<div class="col-xs-7" data-bind="text: name"></div>
这是一个Ajax驱动的网站,所有数据被加载的Javascript。 –