如果我有一个简单的表格,如:先进的聚集大熊猫蟒蛇
index location col1 col2 col3 col4
1 a TRUE yes 1 4
2 a FALSE null 2 6
3 b TRUE null 6 3
4 b TRUE no 3 4
5 b FALSE yes 4 6
6 c TRUE no 57 8
7 d FALSE null 74 9
如果我想聚集在位置重复的记录,即两个A或三个B的,我一直在使用一个基本groupby函数。这适用于简单的表格。
但是,是否可以扩展此功能,以便在聚合时允许每列的规则?作为col1的一个例子,如果TRUE存在,它会胜过任何FALSE值,或者在col3中,它会对这些值进行求和,而在col4中它会计算平均值?是否可以为每列定义这些规则,然后在使用groupby时应用它们?
我在网上搜索,但没有发现任何似乎覆盖这个,但我可能会吠叫错误的树。
谢谢。
您可以发布想要的/预期的数据集吗? – MaxU