我使用os列出目录中的文件名。我也使用熊猫来列出CSV文件中一列的内容。我已经打印了两者的结果,现在我想匹配出现在两个打印件中的名称,并确定哪些名称对一个打印件是独占的。以下是我的代码,它可以获取CSV文件的名称和内容。在两张照片中匹配相同的单词
import os, sys
import pandas as pd
path = "/mydir/csvfile"
dirs = os.listdir(path)
for file in dirs:
print file
fields = ['Column']
df = pd.read_csv('/mydir/csv_file', skipinitialspace=True, usecols=fields)
print df.Column
*编辑*
我想出了这个解决方案,它的工作原理。
import os, sys
import pandas as pd
path = "/mdir/csvfile"
dirs = os.listdir(path)
list_1 = [file for file in dirs]
fields = ['column']
df = pd.read_csv('/mydir/csvfile', skipinitialspace=True, usecols=fields)
list_2 = df.column.values.tolist()
list_3=[]
for i in list_1:
if i in list_2:
list_3.append(i + " True")
else:
list_3.append(i + " False")
print list_3
意识到我忘了真的有问题。我将如何去做这件事,有没有办法比较和匹配两个打印? –
不打印,将这些值保存到变量并比较这些变量。 –