2010-12-06 32 views
3

客户端拥有一个大型文档管理系统 - 数百万个TIFF和PDF以及更少的其他随机文件;图像和其他二进制文件。我正在转换格式,记录笔记,重新组织和发现敏感信息。这对于大量的文件来说都很棒。如何研究不明确的文件类型?

但我偶尔会发现一种新格式,必须弄清楚它是什么以及如何在项目参数中处理它。通常情况下,这不是太难,当它已经是,这是一小撮,如果我无法处理它,无关紧要。但现在,我有一大堆文件看起来没有复杂的头文件,但都以“COM1.0”(43 4F 4D 31 2E 30)开头。

所以,我想在两个层面上提供帮助。对我来说,研究这个问题的方法是什么(以及我将来可能会找到的其他方法 - 教导一个人去钓鱼,等等)。当只是谷歌搜索失败了我?如果你知道文件类型是什么,我很乐意听到它。

+0

因为我正在做同样的事情,所以我可能会有所帮助。我被困在同一个地方。我GOOGLE了很多,无法找到这是什么样的文件。我相信它是用PKZIP压缩COLD文本。但是,我无法解压缩它。 COLD文本是(计算机输出到激光磁盘)数据。你有没有发现任何东西? – BWK1954 2013-03-13 16:57:16

+0

我也面临同样的难题。我也在处理一个“大型文档管理系统”(可能是同一个系统),并且有很多我不能识别的“COM1.0”文件。 – 2013-03-13 20:12:46

+0

对不起,我没有什么好的建议。我们从来没有弄清楚这些文件是什么,只是告诉我们的客户我们无法处理它们。 – clweeks 2013-03-18 15:27:06

回答

0
  1. Google
  2. 如果谷歌失败,它可以是对你的客户的东西。
4

祝你好运,但请记住,并非每个文件格式都记录在创建它的公司之外;而且很少有公司在发布之前公布他们的文件格式。

取决于这些文件的年龄,除非您有一些额外的提示(例如与文件关联的程序的名称),否则击中砖墙的几率很高。