2012-04-24 46 views

回答

2

你真的需要与JavaScript交互吗?

您可以通过查看AJAX请求逆向工程reddit的代码使用萤火虫或其他任何调试,检查饼干,请求参数等

在这之后,你可以模拟通过设置相同的请求类型这就要求使用Python的urllib的制作(GET与POST),请求参数和cookie。

还要检查这个帖子web-scraping-with-python

1

除了@马克西姆的上述伟大的建议,你也可以使用像Selenium浏览器测试工具(有Python绑定)来编写一个脚本来直接与reddit的页面交互。缺点是它会在每次运行时打开浏览器的副本,我不确定这是否会对您造成影响。

+0

如果你走这条路,我*高*建议分裂:http://splinter.cobrateam.info/ – 2012-04-24 00:37:37

+0

感谢迈克提到分裂。我已经使用硒,风车(http://www.getwindmill.com/),这也看起来很有希望。 – 2012-04-24 01:54:45

+0

除此之外,您可以使用greasemonkey将自定义JavaScript注入到网页中 - https://addons.mozilla.org/en-US/firefox/addon/greasemonkey/ Selenium是JavaScript的主要测试工具,与GreaseMonkey相比,Selenium的开销更大 – 2012-04-24 01:57:50

相关问题