16
大压缩文本文件,行,我试图用zip文件模块读取文件中的档案。未压缩文件为〜3GB,压缩文件为200MB。我不希望他们在内存中,因为我一行一行地处理压缩文件。到目前为止,我已经使用下面的代码注意到一个内存过度使用:读取线蟒蛇
import zipfile
f = open(...)
z = zipfile.ZipFile(f)
for line in zipfile.open(...).readlines()
print line
我使用SharpZipLib做到了在C#:
var fStream = File.OpenRead("...");
var unzipper = new ICSharpCode.SharpZipLib.Zip.ZipFile(fStream);
var dataStream = unzipper.GetInputStream(0);
数据流被压缩。我似乎无法找到一种方法来在Python中完成它。帮助将不胜感激。
不能说比这更好的 – 2012-07-14 08:55:32