2015-03-02 140 views
0

我需要遍历22GB gzip文件中的行。扩展后,文件为250GB(这是Google Freebase db dumpnode.js如何流化22GB gzip压缩文件解压缩

我对流并不太了解。有没有办法在我去的时候流文件和gunzip?

这里打算的其他方式:

var r = fs.createReadStream('file.txt'); 
var z = zlib.createGzip(); 
var w = fs.createWriteStream('file.txt.gz'); 
r.pipe(z).pipe(w); 
+0

即数据的大规模** **量;通常这些数据实际上只用于媒体系统(音乐,视频),可以使用行业标准过程(CODEC)进行* CO *压缩和* DEC压缩。你需要流传什么样的数据呢? – Claies 2015-03-02 23:59:05

+0

这是Google Freebase转储。它只有一个尺寸。 – metalaureate 2015-03-03 00:31:39

回答

3

下面是使用zlib.createGunzip的反向操作,而不是zlib.createGzip

var r = fs.createReadStream('file.txt.gz'); 
var z = zlib.createGunzip(); 
var w = fs.createWriteStream('file.txt'); 
r.pipe(z).pipe(w); 
+0

谢谢 - 最后一件事:我将如何限制前1000行? – metalaureate 2015-03-03 13:22:57