我想通过Scrapy刮一个网站。但是,该网站有时非常缓慢,并且在浏览器中首次请求时需要花费将近15-20秒的时间。无论如何,有时候,当我尝试使用Scrapy抓取网站时,我不断收到TCP超时错误。即使网站在我的浏览器上打开状况良好。这里的消息:Scrapy - 设置TCP连接超时
2017-09-05 17:34:41 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET http://www.hosane.com/result/spec
ialList> (failed 16 times): TCP connection timed out: 10060: A connection attempt failed because the connected party di
d not properly respond after a period of time, or established connection failed because connected host has failed to re
spond..
我甚至覆盖了USER_AGENT
设置进行测试。 我不认为DOWNLOAD_TIMEOUT
设置在这种情况下工作,因为它默认为180秒,并且在给出TCP超时错误之前,Scrapy甚至不需要20-30秒。
任何想法是什么导致这个问题?有没有办法在Scrapy中设置TCP超时?
非常感谢!这似乎是正确的答案。试用后我会尽快回复您! :) – Asym
请注意,对于我来说,即使超时时间很长,该网站并没有每次都做出回应,而且通常也没有。 –
但是我能够在我的浏览器中访问该网站...那么为什么它与Scrapy的行为不同,即使是用户代理... – Asym