我有一个列表,让我们说,看起来像这样(这我把成DF):熊猫:由列拖放准重复值
[
['john', '1', '1', '2016'],
['john', '1', '10', '2016'],
['sally', '3', '5', '2016'],
['sally', '4', '1', '2016']
]
columns
是['name', 'month', 'day', 'year']
我基本上只想输出一个新的DF,每个人只有最旧的行。所以它应该包含两行,一个在1/1/16的约翰和一个在3/5/16的萨利。
在DF的这种选择中,我一直都很难过,希望有人能提供一些关于如何完成上述的建议。
排序由'name'是没有必要的,是吗? –
不,不过,如果我要查看一个intermdeiate的结果,我想保留名字。虽然没有必要。 – piRSquared