2015-03-03 58 views
0

我正在努力做一些关于熊猫数据框的数据争夺。我一直在这个问题上停留了2天。与python熊猫数据争执

我有一个数据帧,看起来像这样:

['a','e'] 
['b','f'] 
['c','g'] 
['d','h'] 
['a','i'] 
['b','j'] 
['c','k'] 
['d','l'] 

,我需要把它变成这样看

['a',['e','i']] 
['b',['f','j']] 
['c',['g','k']] 
['d',['h','l']] 

所以基本上旋转第一列周围的原始数据帧和然后从第二列创建一个字符串列表。

感谢

回答

3

你可以使用groupy/agg

import pandas as pd 

data = [['a','e'], ['b','f'], ['c','g'], ['d','h'], ['a','i'], ['b','j'], 
     ['c','k'], ['d','l']] 

df = pd.DataFrame(data, columns=['first', 'second']) 
print(df.groupby(['first']).agg(lambda x: x.tolist())) 

产量

 second 
first   
a  [e, i] 
b  [f, j] 
c  [g, k] 
d  [h, l] 
+0

奏效谢谢!看起来很简单。 – user1274037 2015-03-03 03:19:04