删除所有空操作.bz2文件,我有一个文件夹(实际上HDFS上,但我不认为这会影响这个问题)的操作.bz2文件。其中一些解压缩时会给出单个空文件。我想删除所有解压缩为空的.bz2文件,我注意到它们都具有14个字节的大小。简单地删除所有14个字节的文件是否安全?或者是否有可能将一个非空文件压缩到/从一个14字节的bz2解压缩?从文件夹
从文件夹
回答
BZ2是由BZIP 2. BZIP 2中使用的压缩文件格式是Julian Seward写创建一个开放和自由压缩程序。 BZ2文件使用Burrows-Wheeler压缩算法结合运行长度编码(RLE)进行最大压缩。 link
如果你想删除这些文件,先用下面的代码片断。广州文件的详细信息。
解压文件GZ2
gunzip -c test.bz2 | hadoop fs -put - /path/filepath
阅读其内容
hadoop fs -text /path_for_hdfs/test.bz2 | hadoop fs -put /hdfs_path/abc.txt
我创建一个空的文本文件,并使用bzip2压缩并插入到HDFS。 空的bzip2文件的大小是14B。 当我做与非空文件(只有一个字符)相同时它是39字节。
我的结论是,所有的bzip2 14B文件将是空的。
使自己desition根据测试用例...
但是,任何人都可以解释为什么一个14字节的bz2文件会一直解压缩到一个空文件?即您的答案似乎基于归纳推理,但是在潜在的数据丢失问题上,我会因为基于演绎推理的答案而感到更安全。 – tex94
“为什么一个14字节的bz2文件总是会解压到一个空文件。” 使用bzip2压缩的空文件将为14B。 但我不知道14B大小的确切原因 – Rahul
我接受,但可能由于某种原因,非空文件也会压缩到14个字节?仅仅说明一个字符压缩到14个字节是不够的,因为压缩算法很容易被假设为压缩说8,16或32个字符的副本比单个字符的空间要小。我希望有一个具有bz2领域特定知识的人可以提供答案...... – tex94
- 1. 从文件夹
- 2. 从文件夹
- 3. 文件夹从文件
- 4. Makefile文件 - 从文件夹
- 5. 从exluding文件夹
- 6. 如何将文件从子文件夹移动到文件夹
- 7. 从CSV文件中的文件夹批空子文件夹
- 8. 将文件从源文件夹复制到目标文件夹
- 9. 从public_html文件夹内编辑public_html文件夹外的文件
- 10. 从文件夹内的文件夹读取文件
- 11. 从文件夹和子文件夹中删除文件
- 12. 将文件夹从一个文件夹复制到一个新文件夹
- 13. iphone将文件夹从文件夹复制到文档
- 14. 从虚拟文件夹检索文件
- 15. 从文件夹创建zip文件
- 16. 从文件夹中删除文件
- 17. 在PHP从文件夹访问文件
- 18. 从不同文件夹导入文件
- 19. tidytext从文件夹中读取文件
- 20. 从父文件夹typescript导入文件
- 21. 如何从文件夹下载文件?
- 22. 从Res文件夹中读取文件
- 23. 从文件夹获取文件
- 24. 读WAR文件从src文件夹类
- 25. 从文件夹获取文件名
- 26. SVN:从文件夹内移动文件
- 27. Yii2从文件夹中删除文件
- 28. 从文件夹打印文件
- 29. 从R.raw文件夹打开文件
- 30. 从.war文件中排除文件夹
我真的不希望有,虽然解压缩所有文件...问题是,我可以保证一个14字节BZ2是空的? – tex94