我想编写一个python脚本,它将要求reddit发布url,转到页面,使用指定的帐户登录,并提出帖子和注销。可以httplib(python)与页面及其javascript相互作用吗?
A)这可以用python来完成吗?
B)我该怎么做?如果你能提供很棒的代码,但不要自杀。
我想编写一个python脚本,它将要求reddit发布url,转到页面,使用指定的帐户登录,并提出帖子和注销。可以httplib(python)与页面及其javascript相互作用吗?
A)这可以用python来完成吗?
B)我该怎么做?如果你能提供很棒的代码,但不要自杀。
你真的需要与JavaScript交互吗?
您可以通过查看AJAX请求逆向工程reddit的代码使用萤火虫或其他任何调试,检查饼干,请求参数等
在这之后,你可以模拟通过设置相同的请求类型这就要求使用Python的urllib的制作(GET与POST),请求参数和cookie。
还要检查这个帖子web-scraping-with-python
除了@马克西姆的上述伟大的建议,你也可以使用像Selenium浏览器测试工具(有Python绑定)来编写一个脚本来直接与reddit的页面交互。缺点是它会在每次运行时打开浏览器的副本,我不确定这是否会对您造成影响。
如果你走这条路,我*高*建议分裂:http://splinter.cobrateam.info/ – 2012-04-24 00:37:37
感谢迈克提到分裂。我已经使用硒,风车(http://www.getwindmill.com/),这也看起来很有希望。 – 2012-04-24 01:54:45
除此之外,您可以使用greasemonkey将自定义JavaScript注入到网页中 - https://addons.mozilla.org/en-US/firefox/addon/greasemonkey/ Selenium是JavaScript的主要测试工具,与GreaseMonkey相比,Selenium的开销更大 – 2012-04-24 01:57:50