在此先感谢您的任何帮助。我甚至不确定这是否可行,但我试图使用它们的哈希来获取重复文件列表,以确定与哈希关联的文件列表。从Linq查询返回字典<FileHash,string []>
我有下面这样:
Dictionary<FileHash, string[]> FindDuplicateFiles(string searchFolder)
{
Directory.GetFiles(searchFolder, "*.*")
.Select(
f => new
{
FileName = f,
FileHash = Encoding.UTF8.GetString(new SHA1Managed()
.ComputeHash(new FileStream(f,
FileMode.
OpenOrCreate,
FileAccess.Read)))
})
.GroupBy(f => f.FileHash)
.Select(g => new
{
FileHash = g.Key,
Files = g.Select(z => z.FileName).ToList()
})
.GroupBy(f => f.FileHash)
.Select(g => new {FileHash = g.Key, Files = g.Select(z => z.Files).ToArray()});
它编译罚款,但我只是好奇,是否有甚至操纵的结果返回一个字典的方式。
任何建议,替代品,批评将不胜感激。
如果你切换到C#您应该使用EnumerateFiles代替的GetFiles 4已经。 – 2010-09-24 22:26:47
那些最后一行是重复的,是故意的?更好的编辑。 – 2010-09-24 22:28:03
请注意,您无法将任何随机字节序列(例如SHA-1哈希)解码为字符串。 **不是每个字节序列都是有效的UTF-8!** – dtb 2010-09-24 22:30:41