检查当前行中的所有列值是否小于熊猫数据框中的所有先前行

是否有方法检查当前行中的所有列值是否小于所有先前行中的对应列值（直到当前行行）在熊猫数据框中（贯穿整个数据框）并相应创建一个值为1或0的新列？检查当前行中的所有列值是否小于熊猫数据框中的所有先前行

2017-06-15 Harikrishna

考虑数据框df

np.random.seed(1) 
df = pd.DataFrame(np.random.rand(10, 2), columns=list('AB')) 

df 

      A   B 
0 0.417022 0.720324 
1 0.000114 0.302333 
2 0.146756 0.092339 
3 0.186260 0.345561 
4 0.396767 0.538817 
5 0.419195 0.685220 
6 0.204452 0.878117 
7 0.027388 0.670468 
8 0.417305 0.558690 
9 0.140387 0.198101

选项1
cummin与shift
这里的概念是跟踪的最低值是什么，到目前为止为每列。如果特定行上的值小于前一行及其之前的所有行，则它必须是新的最小值。我们可以通过检查它是否小于前一行中的最小值来判断这是否为True。
注意这应该工作得很好，与NaN值。

df.assign(New=(df < df.cummin().shift()).all(1).astype(int)) 

      A   B New 
0 0.417022 0.720324 0 
1 0.000114 0.302333 1 
2 0.146756 0.092339 0 
3 0.186260 0.345561 0 
4 0.396767 0.538817 0 
5 0.419195 0.685220 0 
6 0.204452 0.878117 0 
7 0.027388 0.670468 0 
8 0.417305 0.558690 0 
9 0.140387 0.198101 0

选项2
numpy版
numpy.minimum

v = df.values 
c = np.minimum.accumulate(v[:-1], axis=0) 
df.assign(New=np.append(False, (v[1:] < c).all(1)).astype(int)) 

      A   B New 
0 0.417022 0.720324 0 
1 0.000114 0.302333 1 
2 0.146756 0.092339 0 
3 0.186260 0.345561 0 
4 0.396767 0.538817 0 
5 0.419195 0.685220 0 
6 0.204452 0.878117 0 
7 0.027388 0.670468 0 
8 0.417305 0.558690 0 
9 0.140387 0.198101 0

来源

2017-06-15 00:30:02 piRSquared

@MukarramPasha也许，但我没有想到一种方法来做到这一点。在这个问题中，我关心我当前的行相对于之前的每一行。我不关心与之前的每一行相关的前一行。到目前为止，与累积最低值比较似乎是最好的方法。 – piRSquared

哦，我明白了，谢谢。 *道歉，我错误地删除了我的第一条评论。 –

@MukarramPasha如果你喜欢或欣赏答案，我们谁回应爱情票...只是说' – piRSquared

使用@ piRsuared的DF：

np.random.seed(1) 
df = pd.DataFrame(np.random.rand(10, 2), columns=list('AB')) 
Out[31]: 
      A   B 
0 0.417022 0.720324 
1 0.000114 0.302333 
2 0.146756 0.092339 
3 0.186260 0.345561 
4 0.396767 0.538817 
5 0.419195 0.685220 
6 0.204452 0.878117 
7 0.027388 0.670468 
8 0.417305 0.558690 
9 0.140387 0.198101

您可以使用apply将当前行与前面所有行的最大值进行比较，然后将结果转换为int。

df.apply(lambda x: (x<df[0:x.name].max()).all().astype(int),axis=1) 
Out[30]: 
0 0 
1 1 
2 1 
3 1 
4 1 
5 0 
6 0 
7 1 
8 1 
9 1 
dtype: int64

来源

2017-06-15 01:14:23 Allen

我想将min（）逻辑应用于上面的命令，并且它完美地工作。但让我们说我有一个5行和5列的数据框。如果第一行中的第二列和第三列是Nan，那么对于第三行，此逻辑不起作用。（如果前一行有南），对于下一行逻辑不起作用！我如何处理这个问题？ – Harikrishna

任何人都知道如何使逻辑工作在我的情况。如果在我之前的行中，其中一列是Nan，则应该忽略它，并且必须将所有其他列与前一行进行比较。任何帮助将不胜感激 – Harikrishna

检查当前行中的所有列值是否小于熊猫数据框中的所有先前行

回答

相关问题