2017-06-01 101 views
1

对熊猫比较新 - 我有一个包含电影ID,用户ID,等级和日期的数据框。我已经按用户ID和日期排序,并具有下面的数据框。将转置分组的熊猫数据框输出为CSV

https://i.stack.imgur.com/fqSZ6.png

我所需的输出是指每个用户一行,与该用户已评级排序按时间顺序从左到右的所有电影CSV。例如:

452 4 33 6581 
56 
121 69 98 802 555 
. 
. 

master_sample.sort_values(['User ID','Date']).groupby('User ID') 

然而,通过用户ID分组后,我收到了GROUPBY对象,我不能确定如何遍历并输出到CSV。我已经尝试了使用get_group在原始df/iterated分组的df上的pivot。

任何指针,将不胜感激!

回答

1

试试这个:

master_sample.sort_values('Date') \ 
      .groupby('User ID', as_index=False)['Movie ID'] \ 
      .apply(' '.join) 
+0

我很喜欢它! – piRSquared

+0

@piRSquared,谢谢:) – MaxU

+0

谢谢 - 完美的作品! – Matt