python网站爬虫（多个网站）

我用requests和bs4。在圈子里，我发现只有当我得到每一个“汤”时，最后的“汤”才是正确的。另一个“汤”与HTML源不同。请帮帮我。谢谢。python网站爬虫（多个网站）

for eachLine in files: 
    addr = 'http://neuromorpho.org/neuron_info.jsp?neuron_name='+eachLine 
    print addr 
    st = [] 
    st1 = [] 
    r2 = requests.get(addr) 
    soup2 = bs4.BeautifulSoup(r2.text,"lxml") 
    print soup2

来源

2016-07-29 Pro

请求对象具有具有该网站的所有内容的内容参数，你可以使用BS4

for eachLine in files: 
    addr = 'http://neuromorpho.org/neuron_info.jsp?neuron_name='+eachLine 
    r2 = requests.get(addr) 
    content = r2.content 
    soup2 = bs4.BeautifulSoup(content) 
    print soup2

解析它

来源

2016-07-29 03:37:06

python网站爬虫（多个网站）

回答

相关问题