2
有没有一种方法可以找出未压缩的文件大小对于快速压缩的地板文件而言是什么?我在HDFS目录中有很多parquet文件,我试图找出是否有一种方法来计算文件大小,如果这些数据是未压缩的。找出原始镶木地板文件大小?
有没有一种方法可以找出未压缩的文件大小对于快速压缩的地板文件而言是什么?我在HDFS目录中有很多parquet文件,我试图找出是否有一种方法来计算文件大小,如果这些数据是未压缩的。找出原始镶木地板文件大小?
您可以尝试解压缩数据并查看它消耗了多少空间。请参阅How to decompress the hadoop reduce output file end with snappy?
也许有一种更加优雅的方式我不知道