2
我刚从使用urllib2
作为我的HTTP访问库切换到使用request
库。在urllib中,您使用BeautifulSoup
来使用findAll(tag='element')
函数来拉取html元素,我是否继续以相同的方式使用BeautifulSoup,或者请求是否具有简化此过程的函数?正确的库用法:请求w/bs4.BeautifulSoup?
使用的urllib2
import urllib2
from bs4 import BeautifulSoup as BS
response = urllib2.urlopen('http://stackoverflow.com/')
soup = BS(response)
for a in soup.findAll('a'):
print a['href]
拉动标签使用请求
import response
response = request.get('http://stackoverflow.com/')
for a in response.findAll('a'):
print a['href]