2012-02-15 46 views
1

我正在构建一个应用程序,它需要在不提取文件的情况下读取zip文件内的文件。有没有这种功能的图书馆,或者你能给我一些关于如何解决它的想法吗?是否可以在不提取Objective-C文件的情况下读取压缩文件?

+2

如果你能读一个压缩文件,解压没有它,就不会有任何点在解压所有,你不觉得吗?文件将被永久压缩。 – EmilioPelaez 2012-02-15 08:12:27

+3

@EmilioPelaez:将一部分压缩数据提取到内存中可能很有用,这是一个可以随后处理的未压缩的流。例如,SAX解析器可以在压缩的XML文件上运行,其中部分文件被提取,解析并丢弃或进一步处理。 – 2012-02-15 08:19:54

+2

@EmilioPelaez请先询问为什么在你评论之前做这件事。感谢Alex Reynolds澄清它。 – andsien 2012-02-15 08:40:58

回答

2

您可以一次解压缩一个数据缓冲区,然后通读它,假定文件是文本,并且可以用增量方式解析它(例如,用于处理的XML数据一个SAX解析器)。

这是我写的一个例程,它从zip-stream中提取数据,并一次打印出一行。您可以修改它来打印或解析N字符。或者你可以将行添加到行缓冲区,并且一次处理/解析一大块行。

这使用zlib,如果这个代码是对你有用,可随时使用它:

# 
# compile with -lz option in order to link in the zlib library 
# 

#include <zlib.h> 

#define Z_CHUNK 2097152 

int unzipFile(const char *fName) 
{ 
    z_stream zStream; 
    char *zRemainderBuf = malloc(1); 
    unsigned char zInBuf[Z_CHUNK]; 
    unsigned char zOutBuf[Z_CHUNK]; 
    char zLineBuf[Z_CHUNK]; 
    unsigned int zHave, zBufIdx, zBufOffset, zOutBufIdx; 
    int zError; 
    FILE *inFp = fopen(fName, "rbR"); 

    if (!inFp) { fprintf(stderr, "could not open file: %s\n", fName); return EXIT_FAILURE; } 

    zStream.zalloc = Z_NULL; 
    zStream.zfree = Z_NULL; 
    zStream.opaque = Z_NULL; 
    zStream.avail_in = 0; 
    zStream.next_in = Z_NULL; 

    zError = inflateInit2(&zStream, (15+32)); /* cf. http://www.zlib.net/manual.html */ 
    if (zError != Z_OK) { fprintf(stderr, "could not initialize z-stream\n"); return EXIT_FAILURE; } 

    *zRemainderBuf = '\0'; 
    do { 
     zStream.avail_in = fread(zInBuf, 1, Z_CHUNK, inFp); 
     if (zStream.avail_in == 0) 
      break; 
     zStream.next_in = zInBuf; 
     do { 
      zStream.avail_out = Z_CHUNK; 
      zStream.next_out = zOutBuf; 
      zError = inflate(&zStream, Z_NO_FLUSH); 
      switch (zError) { 
       case Z_NEED_DICT: { fprintf(stderr, "Z-stream needs dictionary!\n"); return EXIT_FAILURE; } 
       case Z_DATA_ERROR: { fprintf(stderr, "Z-stream suffered data error!\n"); return EXIT_FAILURE; } 
       case Z_MEM_ERROR: { fprintf(stderr, "Z-stream suffered memory error!\n"); return EXIT_FAILURE; } 
      } 
      zHave = Z_CHUNK - zStream.avail_out; 
      zOutBuf[zHave] = '\0'; 

      /* copy remainder buffer onto line buffer, if not NULL */ 
      if (zRemainderBuf) { 
       strncpy(zLineBuf, zRemainderBuf, strlen(zRemainderBuf)); 
       zBufOffset = strlen(zRemainderBuf); 
      } 
      else 
       zBufOffset = 0; 

      /* read through zOutBuf for newlines */ 
      for (zBufIdx = zBufOffset, zOutBufIdx = 0; zOutBufIdx < zHave; zBufIdx++, zOutBufIdx++) { 
       zLineBuf[zBufIdx] = zOutBuf[zOutBufIdx]; 
       if (zLineBuf[zBufIdx] == '\n') { 
        zLineBuf[zBufIdx] = '\0'; 
        zBufIdx = -1; 
        fprintf(stdout, "%s\n", zLineBuf); 
       } 
      } 

      /* copy some of line buffer onto the remainder buffer, if there are remnants from the z-stream */ 
      if (strlen(zLineBuf) > 0) { 
       if (strlen(zLineBuf) > strlen(zRemainderBuf)) { 
        /* to minimize the chance of doing another (expensive) malloc, we double the length of zRemainderBuf */ 
        free(zRemainderBuf); 
        zRemainderBuf = malloc(strlen(zLineBuf) * 2); 
       } 
       strncpy(zRemainderBuf, zLineBuf, zBufIdx); 
       zRemainderBuf[zBufIdx] = '\0'; 
      } 
     } while (zStream.avail_out == 0); 
    } while (zError != Z_STREAM_END); 

    /* close gzip stream */ 
    zError = inflateEnd(&zStream); 
    if (zError != Z_OK) { 
     fprintf(stderr, "could not close z-stream!\n"); 
     return EXIT_FAILURE; 
    } 
    if (zRemainderBuf) 
     free(zRemainderBuf); 

    fclose(inFp); 

    return EXIT_SUCCESS; 
} 
+0

谢谢先生,我真的很感谢你的帮助。我会看你的代码并研究它。 – andsien 2012-02-15 08:39:19

+0

我认为他谈论的是压缩档案,所以即使你的代码会有帮助,有趣的部分将是在档案中找到流的开始(并使用正确的算法 - 存储,膨胀等来解压缩它)。 – Sulthan 2013-02-14 16:51:54

+0

目前尚不清楚OP是否意味着一个“zip”文件或简单的压缩文件,但除了解压zip文件成员的默认压缩的zlib包以外,还有可用于“破解”zip文件格式的开源API。 – 2013-02-14 16:55:29

相关问题