我有一个文件结构,看起来大致如下:如何查找并删除重复项并保持最新?
dir1
|--subdir1
|--file1 (modified date1)
|--file2 (modified date2)
|--file3 (modified date1)
|--subdir2
|--file4 (modified date3)
|--file5 (modified date4)
|--file6 (modified date3)
的文件是略有不同的ID3的音乐文件的,所以fdupes不抓住他们为重复虽然他们。我想从dir1
运行一个命令,它将递归到每个子目录中,找到所有文件的最大修改日期,然后提示删除修改日期早于最大日期的任何文件。
有没有办法在linux做到这一点?预期结果将是:
dir1
|--subdir1
|--file1 (modified date1)
|--file3 (modified date1)
|--subdir2
|--file4 (modified date3)
|--file6 (modified date3)
如果文件不完全相同,我们怎么知道一个是另一个重复?如果没有这些信息,您的“预期”结果就会出乎意料。 – tripleee
我知道它们是重复的,因为这些文件最初是由ID3 Artist和Album组织的。有重复的原因是我重新使用略有不同的ID3曲目信息翻录专辑。我没有办法编程检查实际的重复,但我知道他们在那里。 – wesanyer