0
我有具有以下各列的熊猫数据帧:cust_email, transaction_id, transaction_timestamp
子集大熊猫据帧
我想子集大熊猫数据帧和仅包括只有一个交易者的电子邮件ID(即只有一个transaction_id, transaction_timestamp
为cust_email
)
我有具有以下各列的熊猫数据帧:cust_email, transaction_id, transaction_timestamp
子集大熊猫据帧
我想子集大熊猫数据帧和仅包括只有一个交易者的电子邮件ID(即只有一个transaction_id, transaction_timestamp
为cust_email
)
print df
Cust_email transaction_id transaction_timestamp
0 [email protected] A 2015-11-15
1 [email protected] B 2015-11-15
2 [email protected] B 2015-11-15
3 [email protected] C NaT
4 [email protected] A NaT
g = df.groupby('Cust_email').filter(lambda x: len(x) == 1)
print g
Cust_email transaction_id transaction_timestamp
1 [email protected] B 2015-11-15
4 [email protected] A NaT
它是如何工作的? – jezrael
可以u显示你的代码? –
请发布[最小,完整和可验证示例](http://stackoverflow.com/help/mcve)。 –