您可以使用DataFrame.apply
与axis=1
(应用FUNC每一行),并在该函数做你的逻辑。示例 -
df['TOTAL'] = df.apply((lambda row: row[col_names].sum() or row['NEW']), axis=1)
演示 -
In [12]: df
Out[12]:
NEW COL1 COL2
0 1 2 9
1 3 NaN NaN
2 0 7 NaN
In [13]: df['TOTAL'] = df.apply((lambda row: row[col_names].sum() or row['NEW']), axis=1)
In [14]: df
Out[14]:
NEW COL1 COL2 Total
0 1 2 9 11
1 3 NaN NaN 3
2 0 7 NaN 7
问题与Series.where
方法是Series.where
如果条件为true,则返回从Col1
值,否则从NEW
返回值。所以这只会在条件满足的情况下返回NEW
的值(这实际上与您的要求相反)。
这在the documentations -
Series.where(cond, other=nan, inplace=False, axis=None, level=None, try_cast=False, raise_on_error=True)
返回相同的形状自的目的解释,并且其对应的条目是从自其中cond是真,否则来自其他。
所以你想要做的是否定你现在正在做的事情。示例 -
In [22]: df.COL1.where((df.NEW>0 & (df[column_names].sum(axis=1) == 0)),df.NEW)
Out[22]:
0 2
1 NaN
2 0
Name: COL1, dtype: float64
In [23]: df.COL1.where(~(df.NEW>0 & (df[column_names].sum(axis=1) == 0)),df.NEW)
Out[23]:
0 1
1 3
2 7
Name: COL1, dtype: float64
另外请注意df.COL1
回报的新系列,它不是就地,您可能要分配回df['COL1']
。
我很感谢您是否也可以解释我的“where”声明中出现了什么问题。谢谢 –
有一件事。我不需要创建一个新的列Total。我想把这个值放在COL1中。 –
@KlausosKlausos你说你想要'TOTAL'。从问题引用 - *我希望将TOTAL的值设置为等于NEW,仅当NEW> 0并且COL1和COL2在一行中的总和等于0时*。如果你想要'COL1'类似的行为,使用'COL1'而不是'TOTAL'。 –