我使用urllib3来爬网。示例代码:Python | HTTP - 如何在下载之前检查文件大小
from urllib3 import PoolManager
pool = PoolManager()
response = pool.request("GET", url)
的问题是,我可以在URL,它是一个真正的大文件的下载,我不是在下载它interseted绊倒。
我发现这个问题 - Link - 它建议使用urllib
和urlopen
。我不想联系服务器两次。
我想限制文件大小为25MB。 有没有办法可以做到这一点urllib3
?
阅读直到你点击25MB,然后取消下载? – jarmod
这是一个选项。我怎样才能做到这一点? –
您可以使用HTTP HEAD谓词并读取Content-Length标题来检索大小。如果服务器省略了Content-Length,除非像jarmod提到的那样开始下载文件,否则无法检查大小。 –