2017-07-15 375 views
1

我在mac上使用lz4并做了一个实验来压缩我的程序中的字符串(名为str)。使用lz4进行C++压缩,压缩信息不如预期

#include <fstream> 
#include <iostream> 
#include "lz4.h" 
using namespace std; 
int main(){ 
    char str[] = "10100100010000100000100000010000000100000000100000000010000000000"; 
    size_t len = sizeof(str); 
    char* target = new char[len]; 
    int nCompressedSize = LZ4_compress_default((const char *)(&str), target, len, len); 

    ofstream os("lz4.dat",ofstream::binary); 
    os.write(target, nCompressedSize); 
    os.close(); 
    delete[] target; 
    target = 0; 

    ifstream is("lz4.dat", ifstream::binary); 
    is.seekg (0,is.end); 
    size_t nCompressedInputSize = is.tellg(); 
    is.clear(); 
    is.seekg(0,ios::beg); 

    //Read file into buffer 
    char* in = new char[nCompressedInputSize]; 
    int32_t n=is.read(in,nCompressedSize); 
    cout<<"Byte number:"<<nCompressedSize<<",file size:"<<n<<",bytes read:"<<in<<endl; 
    is.close(); 
    return 0; 
} 

运行这个程序,我查了 “lz4.dat” 文件:

$ls -lrt lz4.dat 
-rw-r--r-- 1 x staff 34 7 15 14:50 lz4.dat 

这是34个字节,OK,但是程序的输出是:

Byte number:34,file size:1,bytes read:@1010 

很奇怪,似乎收到的文件大小是1个字节,我实际上输出了一些randome @ 1010。为什么我的“is.tellg()”没有得到正确的文件长度?

谢谢。

+0

你检查过nCompressedSize了吗?它是否大于34字节?重点是如果字符串很小,压缩的字符串可能比初始字符串更长 –

回答

2

ifstream::read()不返回读取的字节。它返回一个对*this的引用,其中有operator bool(),我认为这是用在案例中。所以你在n,你会得到操作是否成功。

输出似乎是完全正常的,它是压缩数据的开始。我认为只打印了几个字节,因为它包含一个终止零。它类似于你的输入,因为lz4将文字逐字地放入流中(lz4没有熵编码)