回答
你的连接错误是:socket.error:[错误54]通过对 连接复位当你第一次连接到http://www.gamespot.com 你必须赶上饼干,并用它在响应的头部其他页面。
您只向服务器发送HTTP请求。你需要处理Javascript来获取内容。
带有Javascript支持的无头浏览器,如Ghost,它会是一个不错的选择。
from ghost import Ghost
ghost = Ghost()
ghost.open(link)
page, resources = ghost.evaluate('document.documentElement.innerHTML;')
soup = BeautifulSoup(page)
.evaluate('document.documentElement.innerHTML')
将显示动态生成的内容,而不是你会看到考虑看看源的静态。
显然,鬼没有打开的属性?我安装在http://ghostpy.readthedocs.org/en/latest/#examples这里显示的依赖关系上,但ghost.open()不可用。 – Aerole
它有。 您需要先安装pyqt4。你有这里的二进制文件:http://www.riverbankcomputing.co.uk/software/pyqt/download 然后'pip安装ghost.py'。不仅'鬼' –
- 1. 美丽的汤URL错误
- 2. 美丽的汤错误
- 3. 美丽的汤分拣输出
- 4. 将美丽的汤输出写入CSV
- 5. 蟒蛇美丽的汤输出到excel
- 6. 美丽的汤的Unicode编码错误
- 7. 美丽的汤空元素错误
- 8. 美丽的汤无类型错误
- 9. Python美丽的汤
- 10. 与美丽的汤
- 11. Python美丽的汤 - 获取输入值
- 12. 美丽的汤错误:列表索引超出范围
- 13. 美丽的汤表没有出现
- 14. 美丽的汤和uTidy
- 15. 美丽的汤 - 文档
- 16. python 3的美丽汤4
- 17. 与美丽的汤解析
- 18. 美丽的汤VS ESPN
- 19. 美丽的汤解析表
- 20. Python美丽的汤编码
- 21. 美丽的汤安装
- 22. Webscrape没有美丽的汤
- 23. 刮表与美丽的汤
- 24. python re.compile美丽的汤
- 25. Python的美丽汤参数
- 26. 美丽的汤4混乱
- 27. 美丽的汤臭虫?
- 28. 美丽的汤发现XML
- 29. 美丽的汤线匹配
- 30. 安装美丽的汤
它可能会阻止/重定向你认为你是一个bot:你可能必须设置你的用户代理。 –