2016-07-28 121 views
4

如何基于两列的值在熊猫中进行条件分配?从概念上类似以下内容:熊猫,基于列值的条件列分配

Column_D = Column_B/(Column_B + Column_C) if Column_C is not null else Column_C 

具体的例子:

import pandas as pd 
import numpy as np 
df = pd.DataFrame({'b': [2,np.nan,4,2,np.nan], 'c':[np.nan,1,2,np.nan,np.nan]}) 


    b c 
0 2.0 NaN 
1 NaN 1.0 
2 4.0 2.0 
3 2.0 NaN 
4 NaN NaN 

我想有一个新的列d,其结果是由bc总和b列的划分,如果c不为空,否则该值应该是列c处的值。 概念上的东西像下面这样:

df['d'] = df['b']/(df['b']+df['c']) if not df['c'].isnull() else df['c'] 

期望的结果:

 b c   d 
0 2.0 NaN  NaN 
1 NaN 1.0  1.0 
2 4.0 2.0  0.66 
3 2.0 NaN  NaN 
4 NaN NaN  NaN 

我怎样才能做到这一点?

回答

6

试试这个(如果你想拥有你想要的结果集 - 检查b列):

In [30]: df['d'] = np.where(df.b.notnull(), df.b/(df.b+df.c), df.c) 

In [31]: df 
Out[31]: 
    b c   d 
0 2.0 NaN  NaN 
1 NaN 1.0 1.000000 
2 4.0 2.0 0.666667 
3 2.0 NaN  NaN 
4 NaN NaN  NaN 

或此,检查c柱:

In [32]: df['d'] = np.where(df.c.notnull(), df.b/(df.b+df.c), df.c) 

In [33]: df 
Out[33]: 
    b c   d 
0 2.0 NaN  NaN 
1 NaN 1.0  NaN 
2 4.0 2.0 0.666667 
3 2.0 NaN  NaN 
4 NaN NaN  NaN 
+0

简短而亲切。谢谢! – CentAu

+0

@CentAu,欢迎您! :) – MaxU

+1

@MaxU +1和gratz [熊猫]徽章。 – piRSquared