如何根据给定的标准填写一些字段？

df: 
NEW COL1 COL2 
1 2  9 
3 NaN NaN 
0 7  NaN 

column_names = [COL1,COL2]

我想设置TOTAL的值等于新的，只有当新的> 0且连续总和超过COL1 COL2和等于0如何根据给定的标准填写一些字段？

这是我要做的事，但结果不正确（即COL1在相应的行中等于0）。例如，在第二行COL1将需要等于3，但它是等于0

df[column_names] = df[column_names].fillna(0) 
df.COL1.where((df.NEW>0 & (df[column_names].sum(axis=1) == 0)),df.NEW)

来源

2015-10-16 Klausos Klausos

您可以使用DataFrame.apply与axis=1（应用FUNC每一行），并在该函数做你的逻辑。示例 -

df['TOTAL'] = df.apply((lambda row: row[col_names].sum() or row['NEW']), axis=1)

演示 -

In [12]: df 
Out[12]: 
    NEW COL1 COL2 
0 1  2  9 
1 3 NaN NaN 
2 0  7 NaN 

In [13]: df['TOTAL'] = df.apply((lambda row: row[col_names].sum() or row['NEW']), axis=1) 

In [14]: df 
Out[14]: 
    NEW COL1 COL2 Total 
0 1  2  9  11 
1 3 NaN NaN  3 
2 0  7 NaN  7

问题与Series.where方法是Series.where如果条件为true，则返回从Col1值，否则从NEW返回值。所以这只会在条件满足的情况下返回NEW的值（这实际上与您的要求相反）。

这在the documentations -

Series.where(cond, other=nan, inplace=False, axis=None, level=None, try_cast=False, raise_on_error=True)

返回相同的形状自的目的解释，并且其对应的条目是从自其中cond是真，否则来自其他。

所以你想要做的是否定你现在正在做的事情。示例 -

In [22]: df.COL1.where((df.NEW>0 & (df[column_names].sum(axis=1) == 0)),df.NEW) 
Out[22]: 
0  2 
1 NaN 
2  0 
Name: COL1, dtype: float64 

In [23]: df.COL1.where(~(df.NEW>0 & (df[column_names].sum(axis=1) == 0)),df.NEW) 
Out[23]: 
0 1 
1 3 
2 7 
Name: COL1, dtype: float64

另外请注意df.COL1回报的新系列，它不是就地，您可能要分配回df['COL1']。

来源

2015-10-16 15:41:54

我很感谢您是否也可以解释我的“where”声明中出现了什么问题。谢谢 –

有一件事。我不需要创建一个新的列Total。我想把这个值放在COL1中。 –

@KlausosKlausos你说你想要'TOTAL'。从问题引用 - *我希望将TOTAL的值设置为等于NEW，仅当NEW> 0并且COL1和COL2在一行中的总和等于0时*。如果你想要'COL1'类似的行为，使用'COL1'而不是'TOTAL'。 –

如何根据给定的标准填写一些字段？

回答

相关问题