逐行比较文件python

第一个索引通过排序列表的最优雅方式是什么？输入：逐行比较文件python

Meni22 xxxx xxxx 
Meni32_2 xxxx xxxx 
Meni32_2 xxxx xxxx 
Meni45_1 xxxx xxxx 
Meni45_1 xxxx xxxx 
Meni45 xxxx xxxx

它是由线走线槽线：

list1 = [] 
list2 = [] 
for line in input: 
    if line[0] not in list1: 
    list.append(line) 
else: 
    list2.append(line)

实例不会明显工作。它添加行[0]的第一个匹配并继续。我宁愿让它通过列表，添加到list1行，它只发现一次，并休息到list2。

脚本后：

List1: 

Meni22 xxxx xxxx 
Meni45 xxxx xxxx 

List2: 

Meni45_1 xxxx xxxx 
Meni45_1 xxxx xxxx 
Meni32_2 xxxx xxxx 
Meni32_2 xxxx xxxx

来源

2013-05-14 jester112358

这些'xxxx xxxx'对于每一条开始相同的行都是一样的吗？ – geoffspear 2013-05-14 10:30:16

您的输入有多少列？两三个？ – jamylak 2013-05-14 10:30:17

目前还不清楚你想在这里实现什么。根据“脚本之后”部分，您是否想根据第一个标记是否包含下划线将输入拆分为两个列表？ – Aya 2013-05-14 10:34:11

您可以使用collections.Counter：

from collections import Counter 
lis1 = [] 
lis2 = [] 
with open("abc") as f: 
    c = Counter(line.split()[0] for line in f) 

for key,val in c.items(): 
    if val == 1: 
     lis1.append(key) 
    else: 
     lis2.extend([key]*val) 
print lis1 
print lis2

输出：

['Meni45', 'Meni22'] 
['Meni32_2', 'Meni32_2', 'Meni45_1', 'Meni45_1']

编辑：

from collections import defaultdict 
lis1 = [] 
lis2 = [] 

with open("abc") as f: 
    dic = defaultdict(list) 
    for line in f: 
     spl =line.split() 
     dic[spl[0]].append(spl[1:]) 

for key,val in dic.items(): 
    if len(val) == 1: 
     lis1.append(key) 
    else: 
     lis2.append(key) 
print lis1 
print lis2 

print dic["Meni32_2"] #access columns related to any key from the the dict

输出：

['Meni45', 'Meni22'] 
['Meni32_2', 'Meni45_1'] 
[['xxxx', 'xxxx'], ['xxxx', 'xxxx']]

来源

2013-05-14 10:38:58

如果文件没有排序，这是一个好方法 – 2013-05-14 10:40:12

很好地工作，但由于我们在这里按[0]分割，它会从列表中删除其他列。那不是打算的。任何方式来解决这个问题？ – jester112358 2013-05-14 11:17:36

@ jester112358是的，你可以在这种情况下使用'collections.defaultdict'，看看我更新的解决方案。 – 2013-05-14 11:23:48

考虑使用difflib

import difflib 

d = difflib.Differ() 
fa = open('a.txt'); fb = open('b.txt') 

diff = d.compare("".join(fa.readlines()), "".join(fb.readlines())) 
print ''.join(list(diff)) 

fa.close(); fb.close()

来源

2013-05-14 10:33:07 0x90

由于文件进行排序，你可以使用groupby

from itertools import groupby 
list1, list2 = res = [], [] 
with open('file1.txt', 'rb') as fin: 
    for k,g in groupby(fin, key=lambda x:x.partition(' ')[0]): 
     g = list(g) 
     res[len(g) > 1] += g

或者如果你喜欢这个更长的版本

from itertools import groupby 
list1, list2 = [], [] 
with open('file1.txt', 'rb') as fin: 
    for k,g in groupby(fin, key=lambda x:x.partition(' ')[0]): 
     g = list(g) 
     if len(g) > 1: 
      list2 += g 
     else: 
      list1 += g

来源

2013-05-14 10:36:48

逐行比较文件python

回答

相关问题