1
我有以下数据框:比较两列数据帧大熊猫创造第三个
In [25]: df1
Out[25]:
a b
0 0.752072 0.813426
1 0.868841 0.354665
2 0.944651 0.745505
3 0.485834 0.163747
4 0.001487 0.820176
5 0.904039 0.136355
6 0.572265 0.250570
7 0.514955 0.868373
8 0.195440 0.484160
9 0.506443 0.523912
现在我想创造另一列df1['c']
,其值将是最大的中df1['a']
和df1['b']
。因此,我想有这样的作为输出:
In [25]: df1
Out[25]:
a b c
0 0.752072 0.813426 0.813426
1 0.868841 0.354665 0.868841
2 0.944651 0.745505 0.944651
3 0.485834 0.163747 0.485834
4 0.001487 0.820176 0.820176
我想:
In [23]: df1['c'] = np.where(max(df1['a'], df1['b'], df1['a'], df1['b'])
但是,这将引发一个语法错误。我看不出有什么办法可以在熊猫中做到这一点。我的实际数据框太复杂了,所以我想为此提供一个通用的解决方案。有任何想法吗?
工作!我不知道大熊猫在哪里。 :) – Peaceful