如果您现在访问this link,您可能会收到VBScript错误。我该如何刮这个框架?
另一方面,如果您访问this link first和,然后上述链接(在同一会话中),页面会通过。
这个应用程序设置的方式,第一页是作为第二(主)页面中的框架。如果你点击一下,你会看到它是如何工作的。
我的问题:我如何用Python刮第一页?我试过了我能想到的所有东西 - urllib,urllib2,机械化 - 我得到的只有500个错误或超时。
我怀疑答案在于机械化,但是我的mechanize-fu不足以解决这个问题。谁能帮忙?
感觉需要编辑这个最优秀的答案,包括URL会话跟踪以及cookie会话跟踪。 – 2009-08-21 21:03:30
谢谢你把我推向正确的方向。你用cookie处理概述的方法是完全正确的解决方案,对我来说,答案是手动处理机械化cookie [如此处所述] [1]。 [Et瞧!] [2] [1] http://wwwsearch.sourceforge.net/mechanize/doc.html [2] http://twitter.com/humboldtCHP – hanksims 2009-08-22 06:24:33