昨天我问了一个类似的问题,但我收录了一些代码,这些代码基本上以我想要的不同切线方式提出了我的问题。所以我会再试一次。从网站打开文件
我正在重写一个抓取网站以查找几百个文本文件的python脚本,我对该文件第二行之外的任何文本文件内容没有兴趣。以前我会下载所有文件,然后循环遍历它们以提取第二行。我现在想在我的脚本发现它时打开每个文件,抓住第二行,并关闭它,而不下载到我的硬盘,然后打开它。
因此,基本上有一种方法可以打开www.example.com/123456.txt中的文件,并将该文件的第二行复制到数组或其他东西,而无需下载并打开它。
不,我是知道的,文件打开到内存中,然后将其丢弃听起来是正确的 – jimstandard
由于'urlopen'返回像文件一样的对象,你可以简单地使用'readline'两次,这可能会避免下载整个文件(取决于缓冲)。无论如何,可能会节省一些大文件传输。 –