压缩类型是否有从其内容可靠地检测出文件的压缩类型的快速方法(即,不从文件扩展名),使用Apache的百科全书压缩 API?检测通过Apache共享压缩
使用阿帕奇提卡,可以做
Tika tika = new Tika();
String path = <the full path to the file examined, including the filename>;
FileInputStream fis = new FileInputStream(new File(path));
String type = tika.detect(fis);
和类型变量被填充有检测MIME类型的文件内容(例如,文本/无格式,应用程序/压缩等)。
理想情况下,我想避免在这个过程中涉及Tika,原因很多,包括Tika似乎错误地检测为AR文档格式的文本/简单格式,这是由Commons Compress生成的格式。
我建议你为AR格式问题打开一个Tika bug,并且包含一个非常小的样本用于单元测试的文件 – Gagravarr