如果第二个元素相同，则将列表中的第一个元素合并为一个元组？

我有元组的列表：如果第二个元素相同，则将列表中的第一个元素合并为一个元组？

[('Donald', 'PERSON'), ('Trump', 'PERSON'), ('enters', 'O'), ('the', 'O'), ('White', 'LOCATION'), ('House', 'LOCATION')]

，我想输出是：

[('Donald Trump'), ('enters the'), ('White House')]

下面的代码让我更接近想要的结果，但我不是很熟悉groupby功能呢。

mergedTags = [] 
    from itertools import groupby 
    for tag, chunk in groupby(tagList, lambda x: x[1]): 
     if tag != "O": 
      tagMerged = " ".join(w for w, t in chunk) 
      mergedTags.extend([tagMerged]) 
     else: 
      #tagMerged = " ".join(t for t, w in chunk) 
      for word, chunk in groupby(tagList, lambda x: x[0]): 
       mergedTags.extend([word]) 

    print(mergedTags)

来源

2017-02-03 Yanic

为什么基于'你有一个条件“O''？ –

斯坦福大学Entitiy识别器标记未被识别为“O”的元素。 – Yanic

您可以使用itertools.groupby与列表理解表达为：

from itertools import groupby 
my_list = [('Donald', 'PERSON'), ('Trump', 'PERSON'), ('enters', 'O'), ('the', 'O'), ('White', 'LOCATION'), ('House', 'LOCATION')] 

output_list = [tuple(i[0] for i in e) for _, e in groupby(my_list, lambda x: x[1])] 
#    ^generate the desired tuple

凡output_list数值保持将是：

[('Donald', 'Trump'), ('enters', 'the'), ('White', 'House')]

来源

2017-02-03 17:03:09

注意：只有它们在一起时，元组才会合并。 'groupby'对连续的元素进行分组。如果有可能被分发;您必须首先根据索引1对输入列表进行排序，即'sorted（my_list，key = lambda x：x [1]）' –

如果第二个元素相同，则将列表中的第一个元素合并为一个元组？

回答

相关问题