2
我正在研究这个基地的刮板/爬行器,它工作正常,直到它得到.net生成的herf链接__doPostBack(...),任何想法如何处理这个和抓取页面后面的链接?关于如何刮掉__doPostBack('...')后面的页面的任何想法?
我正在研究这个基地的刮板/爬行器,它工作正常,直到它得到.net生成的herf链接__doPostBack(...),任何想法如何处理这个和抓取页面后面的链接?关于如何刮掉__doPostBack('...')后面的页面的任何想法?
而不是尝试自动点击JavaScript按钮,这需要PHP中的附加库,请尝试复制点击按钮后浏览器发送的请求。有各种Firefox扩展可以帮助您检查请求,例如TamperData,Firebug和LiveHttp。
humm ..这可能是个好主意我没有真正想过复制标题信息,我会试一试,让你知道thanx很多plumo – Aman 2011-04-15 04:10:45
我试过了,但这个.net窗体似乎是发送值用某种编码格式的头文件FwEPDwUKMTg4OTUzMTc1MQ9kFgICAw9kFhACBQ8QDxYGHg1EYXR .... – Aman 2011-04-15 04:43:33
尝试提交该头文件 – hoju 2011-04-20 02:19:03