我使用python 2.6在Linux上。在一个文件中使用文本搜索赛在第二个文件
我有两个文本文件 first.txt对每行文本的一个字符串。所以它看起来像
LOREM
议会联盟
ASFD
第二个文件不相当有相同的格式。 它看起来更像是这个
1231 LOREM
1311 assss 311
等
我想借此从first.txt文本的每一行,并确定是否有在第二个文本匹配。如果没有匹配,我想将缺失的文本保存到第三个文件。我想忽略情况,但并非完全必要。这就是为什么我在看正则表达式,但没有多少运气。
所以我打开文件,使用readlines方法()来创建一个列表。
遍历列表并打印出匹配项。
这里是我的代码
first_file=open('first.txt', "r")
first=first_file.readlines()
first_file.close()
second_file=open('second.txt',"r")
second=second_file.readlines()
second_file.close()
while i < len(first):
j=search[i]
while k < len(second):
m=compare[k]
if not j.find(m):
print m
i=i+1
k=k+1
exit()
这绝对不是优雅。任何人都有建议如何解决这个问题或更好的解决方案?
lorem`是否也匹配`somelorem`?整条线是否应该完全相同?应该只有单词是相同的? – Wolph 2011-02-13 06:05:29