我做了一个屏幕抓取模块,它工作得很好,但有一定的局限性。现在我想删除这些边界,但我得到如此不可预知和不同的错误。在你脑子里有什么事情之前,让我wat实际上是在发作。最初我使用屏幕抓取来检索一组关键字(搜索内容)的搜索结果,谷歌的所有搜索引擎如co.in/co.uk/nl/de/com。在PHP问题屏幕抓取
但是现在我不得不在一个循环中搜刮多个搜索引擎和多个关键字的逻辑。
让我们看看这个用一个例子:
keyword se company rank
telephony google.co.in airtel 01
telephony google.co.in bsnl 04
telephony google.co.in aircel 06
telephony google.co.in idea 03
mobile op google.co.uk airtel 09
mobile op google.co.uk bsnl 04
等.. 超过6个关键字和所有显示的搜索引擎,并为所有的公司。
最初我是为一个关键字,se和所有company.reporting它现在我必须列出所有关键字,se,公司。简单地我用循环做that.But我面临这些错误:
- 存储器分配343322111个字节溢出(... [移除此我使用的ini_set(“存储器”)FUNC]
- 总和请求后谷歌使用capcha。 删除capcha我使用sleep或usleep()但它不能解决purpose.atlast错误:连接重置 我无法在usleep中使用30sec或更长func.it需要几小时才能恢复info.My代码搜索数据为5页的谷歌,这意味着50 responses.Lib使用
simple_html_dom.php
它工作正常1页页面但不超过3页。我该怎么做/使用?
您是否尝试将时间限制设置为0? “参数或者set_time_limit(0);”。对于文档:http://php.net/manual/en/function.set-time-limit.php(默认是30秒,我猜) – frail 2011-04-01 12:09:16
是的,它被使用。因为只有我能够执行一个页面。因为可能会出现带宽有限的情况。 – 2011-04-01 12:11:26