2010-06-11 86 views

回答

10

Here是ForensicsWiki的一个链接,它详细介绍了很多不同的文件类型。它描述了DOC和DOCX文件的标题,所以你应该能够解析文件并确定它们是什么类型。

综观链接,.doc文件是OLE复合文件,该文件应具有以下二进制头:

d0 cf 11 e0 a1 b1 1a e1 

在constrast,.DOCX文件将具有二进制签名:

50 4b 
+0

如果一个docx文件受密码保护,那么它也会在标题中包含'd0 cf 11 e0 a1 b1 1a e1'。 – SolidSun 2015-09-03 08:03:14

9

DOCX文件是ZIP格式,其中前两个字节是字母PK(在ZIP的创建者Phil Katz之后)。

+0

谢谢你们,似乎很清楚和容易 – Andriy 2010-06-11 14:47:20