我有一个数据帧“东风”,看起来像这样:Python的熊猫数据帧的GroupBy大小根据病情
id date1 date2
1 11/1/2016 11/1/2016
1 11/1/2016 11/2/2016
1 11/1/2016 11/1/2016
1 11/1/2016 11/2/2016
1 11/2/2016 11/2/2016
2 11/1/2016 11/1/2016
2 11/1/2016 11/2/2016
2 11/1/2016 11/1/2016
2 11/2/2016 11/2/2016
2 11/2/2016 11/2/2016
我想这样做是为了GROUPBY的ID,然后得到每个ID在该尺寸日期1 = DATE2。结果应该是这样的:
id samedate count
1 11/1/2016 2
1 11/2/2016 1
2 11/1/2016 2
2 11/2/2016 2
我已经试过这样:
gb=df.groupby(id').apply(lambda x: x[x.date1== x.date2]['date1'].size())
而得到这个错误:
TypeError: 'int' object is not callable
你肯定会标志中的每个实例,其中日期1和date2相等,然后每个相同的日期计算每个ID的标志,但我必须相信有一个groupby选项。
感谢您的 时间。这是一个更好的方法。 – Zero
谢谢你的回答,第一个想法与你的答案非常相似。 – jezrael
谢谢。优秀! – clg4