2015-12-21 92 views
0

我有一个熊猫数据框,其列Cust_email,visit_date_time, transaction_date_timeCust_email包含客户的电子邮件ID,visit_date_time包含客户访问产品时的时间戳,并且transaction_date_time包含交易时间戳,如果客户购买了该产品,则该字段保持空白。来自熊猫的子集数据

现在,我想子集只包含这让ATLEAST一个交易者的电子邮件ID,即熊猫(所有列),我想删除所有对他们的所有visit_date_time,transaction_date_time组合

+0

所以,你要' DF [DF [ 'transaction_date_time']。NOTNULL()]'? – EdChum

+0

否,例如,'abc @ gmail.com'有三条记录,其中两条记录没有'transaction_date_time'。但是既然他做了一笔交易,我还想要他的另外两笔记录。 –

+0

所以你想'df ['df ['Cust_email']。isin(df.loc [df ['transaction_date_time']。notnull(),'Cust_email']。unique())'? – EdChum

回答

0
空条目的电子邮件ID

您可以使用isin来测试你的客户编号的成员,我们过滤那些未完成交易的DF第一,得到了客户的ID从这些行,并传递给isin

df['df['Cust_email'].isin(df.loc[df['transaction_date_time'].notnull(), 'Cust_email'].unique())