2011-06-10 51 views
0

伙计们。获取卷页内容的问题

我有点卡住了目前的情况,我得到了。 我需要检查合作伙伴的网站链接的存在,为此,我试着让页面内容使用以下命令:

"curl -A 'Mozilla\/5.0 (X11; U; Linux i686; hu; rv:1.9.2.12) Gecko\/20101026 Firefox\/3.6.12' -L --retry 2 -s -m 30 --connect-timeout 10 -b \/tmp\/cookie_file.txt -c \/tmp\/cookie_file.txt 'www.partnersite.com\/ 

的事情是,它的工作奇怪:有一段时间,返回页面的内容,然后再次获得空白页面。 所以我检查了服务器的响应,发现有一次响应是:HTTP/1.0 200 OK然后它获得空白页面,然后另一次响应是“HTTP/1.1 302对象移动”,然后获取内容。 怎么可能?你有什么问题吗? 预先感谢您。

+0

您指的是HTTP响应代码为302的空白内容响应吗?或者是这个重定向发送给你的页面是空白的? – benosteen 2011-06-10 10:46:51

+0

当HTTP/1.0 200 OK时,我得到空白页。当它重定向 - 它正常工作 – Kuen 2011-06-10 10:50:15

+0

如果是这样的话,那么它可能是你的网站和你的合作伙伴网站之间的网络上有些东西,可能甚至是他们的网络服务器配置错误?当一切都很好时,你倾向于*不*得到HTTP 200 OK响应! – benosteen 2011-06-10 10:55:49

回答

0

亲爱的,而不是使用cURL使用'simple_html_dom'类,它很容易实现,你也可以找到文档。我用它很久,很简单。与simple_html_dom相关的任何其他问题都与我联系。