2010-06-25 173 views
381

我有一些数据在列表中包含列表,或列表包含元组。如何对列表/元组进行排序(列表/元组)?

data = [[1,2,3], [4,5,6], [7,8,9]] 
data = [(1,2,3), (4,5,6), (7,8,9)] 

而我想按子集中的第二个元素排序。意思是,2,5,8排序,其中2来自(1,2,3),5来自(4,5,6)。通常的做法是什么?我应该在我的列表中存储元组还是列表?由于元组更不灵活。

+24

关于“?我应该保存的元组或列表在我的名单”,经验法则是使事情一成不变地。如果您不需要*修改子列表,请将它们设为元组。 – 2010-06-25 23:10:15

回答

706
sorted_by_second = sorted(data, key=lambda tup: tup[1]) 

或:

data.sort(key=lambda tup: tup[1]) # sorts in place 
+6

任何想法如何将它更大到更小? – billwild 2012-12-19 13:57:23

+42

@billwild:help(sorted)。反向=真。 – Stephen 2012-12-20 15:54:21

+22

@Stephen使用itemgetter更快更简单:'key = itemgetter(1)'并且在文件的开头:'from operator import itemgetter' – Joschua 2013-03-13 20:08:49

25

Stephen's answer是一个我会使用。为了完整起见,这里的DSU(装饰排序 - 去除装饰)模式与列表理解:

decorated = [(tup[1], tup) for tup in data] 
decorated.sort() 
undecorated = [tup for second, tup in decorated] 

或者,更简洁:

[b for a,b in sorted((tup[1], tup) for tup in data)] 

正如Python Sorting HowTo指出,这已经因为Python 2.4已经不必要,当关键功能变得可用时。

+2

所以这个答案对于Python 2.3-有用吗?在更多当前的Python版本中是否有任何有效的用法,你可能会详细阐述一下?如果没有,没有麻烦......只是过去了,看到这个,老noggin只是搅了一下。无论如何,欢呼和感谢,这可以回溯到早期的Python。 – bernie 2012-03-31 08:21:50

117
from operator import itemgetter 
data.sort(key=itemgetter(1)) 
+8

_This应该是被接受的答案._另请参阅[Charlie](https://stackoverflow.com/users/145976/charlie)的[发布时间](https://stackoverflow.com/a/17243726/2809027) ,展示了'itemgetter'类对**的平均排序**比同等的lambda函数平均快126%。 – 2016-11-29 06:07:19

+0

x = [[[5,3],1.0345],[[5,6],5.098],[[5,4],4.89],[[5,1],5.97]我们可以使用itemgetter()对x [0] [1]中的元素进行排序吗? – nidHi 2016-12-02 09:52:29

+0

x = [[[5,3],1.0345],[[5,6],5.098],[[5,4],4.89],[[5,1],5.97] ,我们如何才能对x [0] [1]中的元素进行排序呢? – nidHi 2016-12-02 09:52:43

-6

排序元组是非常简单的:

tuple(sorted(t)) 
28

我只是想,如果你想从高的数组进行排序,以低添加到斯蒂芬的回答,不是在评论以外的其他方式以上只是它添加到行:

reverse = True 

,其结果将是如下:

data.sort(key=lambda tup: tup[1], reverse=True) 
20

对于由多个条件排序,即例如通过在元组中的第二和第三元件,让

data = [(1,2,3),(1,2,1),(1,1,4)] 

等限定的λ,它返回一个描述优先级的元组,例如

sorted(data, key=lambda tup: (tup[1],tup[2])) 
[(1, 1, 4), (1, 2, 1), (1, 2, 3)] 
5

没有拉姆达:

def sec_elem(s): 
    return s[1]
sorted(data, key=sec_elem)
2

itemgetter()lambda tup: tup[1]略快,但涨幅相对较小(约10%至25%)。

(IPython的会话)

>>> from operator import itemgetter 
>>> from numpy.random import randint 
>>> values = randint(0, 9, 30000).reshape((10000,3)) 
>>> tpls = [tuple(values[i,:]) for i in range(len(values))] 

>>> tpls[:5] # display sample from list 
[(1, 0, 0), 
(8, 5, 5), 
(5, 4, 0), 
(5, 7, 7), 
(4, 2, 1)] 

>>> sorted(tpls[:5], key=itemgetter(1)) # example sort 
[(1, 0, 0), 
(4, 2, 1), 
(5, 4, 0), 
(8, 5, 5), 
(5, 7, 7)] 

>>> %timeit sorted(tpls, key=itemgetter(1)) 
100 loops, best of 3: 4.89 ms per loop 

>>> %timeit sorted(tpls, key=lambda tup: tup[1]) 
100 loops, best of 3: 6.39 ms per loop 

>>> %timeit sorted(tpls, key=(itemgetter(1,0))) 
100 loops, best of 3: 16.1 ms per loop 

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0])) 
100 loops, best of 3: 17.1 ms per loop 
4

为了在字母顺序降序排列并word排序元组(<word>, <count>)的列表,为count

data = [ 
('betty', 1), 
('bought', 1), 
('a', 1), 
('bit', 1), 
('of', 1), 
('butter', 2), 
('but', 1), 
('the', 1), 
('was', 1), 
('bitter', 1)] 

我用这个方法:

sorted(data, key=lambda tup:(-tup[1], tup[0])) 

它给了我结果:

[('butter', 2), 
('a', 1), 
('betty', 1), 
('bit', 1), 
('bitter', 1), 
('bought', 1), 
('but', 1), 
('of', 1), 
('the', 1), 
('was', 1)] 
2

@Stephen的回答很重要!这里是一个更好的可视化的例子,

大声喊叫Ready Player粉丝! =)

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')] 
>>> gunters.sort(key=lambda tup: tup[0]) 
>>> print gunters 
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')] 

key是一个将被调用改造集合的产品进行比较..喜欢compareTo方法的Java功能。

传递给键的参数必须是可调用的。在这里,使用lambda创建一个匿名函数(可调用)。
lambda的语法是lambda这个词,后面跟着一个可迭代的名字,然后是一个单独的代码块。

下面的示例中,我们正在对包含某个事件和演员姓名的信息abt时间的元组列表进行排序。

我们按事件发生时间排序此列表 - 这是元组的第0个元素。

注 - s.sort([cmp[, key[, reverse]]])各种各样S的项目在地方