在一个jupyter笔记本中,我有一个从不同的合并数据集创建的数据框。Python /熊猫:枢轴表
record_id | song_id | user_id | number_times_listened
0 |ABC | Shjkn4987 | 3
1 |ABC | Dsfds2347 | 15
2 |ABC | Fkjhh9849 | 7
3 |XYZ | Shjkn4987 | 20
4 |XXX | Shjkn4987 | 5
5 |XXX | Swjdh0980 | 1
我想创建由song_id透视表数据框中列出user_ids的数量和number_times_listened总和。
我知道我需要用count和sum函数创建一个for循环,但是我不能让它工作。我也尝试了熊猫模块的pd.pivot_table。
df = pd.pivot_table(data, index='song_ID', columns='userID', values='number_times_listened', aggfunc='sum')
或者类似的东西?
total_user=[]
total_times_listened =[]
for x in data:
total_user.append(sum('user_id'))
total_times_listened.append(count('number_times_listened'))
return df('song_id','total_user','total_times_listened')
完美工作!谢谢! – jeangelj
对于我的机器学习模型,我需要有一个标题行 - 在这种情况下,我有3个。我一直试图修复它在python中没有成功。尝试删除2个标题行,并有一个行为behavior_df.columns = ['song_id','play_count_sum','user_id_count'] – jeangelj