客户端拥有一个大型文档管理系统 - 数百万个TIFF和PDF以及更少的其他随机文件;图像和其他二进制文件。我正在转换格式,记录笔记,重新组织和发现敏感信息。这对于大量的文件来说都很棒。如何研究不明确的文件类型?
但我偶尔会发现一种新格式,必须弄清楚它是什么以及如何在项目参数中处理它。通常情况下,这不是太难,当它已经是,这是一小撮,如果我无法处理它,无关紧要。但现在,我有一大堆文件看起来没有复杂的头文件,但都以“COM1.0”(43 4F 4D 31 2E 30)开头。
所以,我想在两个层面上提供帮助。对我来说,研究这个问题的方法是什么(以及我将来可能会找到的其他方法 - 教导一个人去钓鱼,等等)。当只是谷歌搜索失败了我?如果你知道文件类型是什么,我很乐意听到它。
因为我正在做同样的事情,所以我可能会有所帮助。我被困在同一个地方。我GOOGLE了很多,无法找到这是什么样的文件。我相信它是用PKZIP压缩COLD文本。但是,我无法解压缩它。 COLD文本是(计算机输出到激光磁盘)数据。你有没有发现任何东西? – BWK1954 2013-03-13 16:57:16
我也面临同样的难题。我也在处理一个“大型文档管理系统”(可能是同一个系统),并且有很多我不能识别的“COM1.0”文件。 – 2013-03-13 20:12:46
对不起,我没有什么好的建议。我们从来没有弄清楚这些文件是什么,只是告诉我们的客户我们无法处理它们。 – clweeks 2013-03-18 15:27:06