2017-04-02 99 views
1

IMAP过滤和搜索规定我的脚本的工作原理如下:每晚我收到一封附有相关.doc文件的电子邮件。我的Python脚本总是选择最近的(最近的)电子邮件,并对该文件执行某些操作。Python:检查“两个”.doc文件是否是相同的文件?

全部.doc每天发送的文件命名完全一样。

问题是:有时寄件人会忽略发送新文件。结果是我的脚本在错误的文件(前一天的文件)上执行了操作。如果我能以某种方式检查两个文件实际上是同一文件的(副本),那么我可以避免执行该操作。

在Python中这是如何最简单/有效地实现的?

回答

1

比较文件的二进制明智的,最好的/最快的方式是使用filecmp模块:

>>> import filecmp 
>>> filecmp.cmp("first.doc","second.doc",shallow=False) 

回报True如果这两个文件共享完全相同的文件内容。 shallow设置为False,因此无论日期有什么差异(当您提取两个文件时都会有这些差异),文件内容将被分析。

相关问题