2010-04-30 114 views
2

所以很少用一些算法来生成基于二进制文件内容的唯一合理长度的文件名。具有相同二进制内容的两个文件应该具有相同的名称。显然这是有限制的,因为大概你不可能有一个唯一的合理长度的文件名,对于一大组大文件中的每一个,只有少数位不同。但大概有一些启发式的,最好的近似,例如利用典型图像文件的已知属性。如果我有一些这样做的算法的名称,我可以谷歌它,并找到其他方法。基于文件内容的文件名

回答

5

使用文件内容的MD5 hash

+0

哈希 - 对。谢谢 – Mark 2010-04-30 18:32:33

+0

其实它发生在我身上,我使用FreImage库从位图生成这些文件,以产生一个JPG或PNG文件。这些文件已经被这种哈希标识符内部标记的机会是什么? – Mark 2010-04-30 18:35:01

+0

FreeImage Library – Mark 2010-04-30 18:35:20

2

我想MD5值得一试。当然,如果内容相同,它会给你相同的结果,但我想你可以增加它,直到你得到唯一的结果。

+0

这就是我想要的 - 为同样的内容提供相同的名称。 – Mark 2010-04-30 18:38:25

+0

那么MD5正是你所需要的。它不难找到它的源代码,我相信你可以找到吨的小命令行工具,将MD5散列。 – m0s 2010-04-30 18:42:08

+0

问,你会收到 - 这个论坛是惊人的(虽然哈希应该发生在我身上)。 – Mark 2010-04-30 18:45:57