Python Pandas：基于其他列添加列

我对熊猫很陌生，对此很陌生，特别是与列表和使用列表解析相比。Python Pandas：基于其他列添加列

我有一个有4列的数据框。我想根据第4列“m”创建第5列“c”。我可以通过为列“m”中的每一行应用我的函数来获得“c”的值。

如果“M”是一个列表，并使用列表理解这将是

c = [myfunction(x) for x in m]

我怎么申请这一“逻辑”的数据帧？

来源

2016-02-16 beginner_

试试这个：** DF [ 'C'] = DF [ 'M']申请（myfunction的）** –

如果你确实需要应用功能分别到每一行，它将是'df ['c'] = df ['m'] .map（myfunction）'。但通常情况下这并不是最好的方法，因为它不利用熊猫的矢量化操作，因为大量操作可以很快地应用到整个列中。如果您可以在帖子中包含更多详细信息，人们可以让您知道实现此目标的最佳方式。 – Marius

您可以assign - 样品从doc：

import pandas as pd 
import numpy as np 

df = pd.DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) 
print df 
    A   B 
0 1 0.769028 
1 2 -0.392471 
2 3 0.153051 
3 4 -0.379848 
4 5 -0.665426 
5 6 0.880684 
6 7 1.126381 
7 8 -0.559828 
8 9 0.862935 
9 10 -0.909402 

df = df.assign(ln_A = lambda x: np.log(x.A)) 
print df 
    A   B  ln_A 
0 1 0.769028 0.000000 
1 2 -0.392471 0.693147 
2 3 0.153051 1.098612 
3 4 -0.379848 1.386294 
4 5 -0.665426 1.609438 
5 6 0.880684 1.791759 
6 7 1.126381 1.945910 
7 8 -0.559828 2.079442 
8 9 0.862935 2.197225 
9 10 -0.909402 2.302585

或者apply为Lu Qi评论。

有时lambda功能是有帮助的：

import pandas as pd 
import numpy as np 

df = pd.DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) 

df['ln_A'] = df['A'].apply(np.log) 
df['round'] = df['B'].apply(lambda x: np.round(x, 2)) 
print df 

    A   B  ln_A round 
0 1 -0.982828 0.000000 -0.98 
1 2 2.306111 0.693147 2.31 
2 3 0.967858 1.098612 0.97 
3 4 -0.286280 1.386294 -0.29 
4 5 -2.026937 1.609438 -2.03 
5 6 0.061735 1.791759 0.06 
6 7 -0.506620 1.945910 -0.51 
7 8 -0.309438 2.079442 -0.31 
8 9 -1.261842 2.197225 -1.26 
9 10 1.079921 2.302585 1.08

来源

2016-02-16 07:12:42 jezrael

由于熊猫是在numpy的顶部。您可以轻松地将功能应用于numpy.array。以下示例可能会有所帮助。您可以将列表（或列）转移到numpy.array，然后进行矢量计算。

import numpy as np 
import pandas as pd 
data = pd.DataFrame([[1,2],[3,4]],columns=['a','b']) 
def square(x): 
    return x ** 2 
data['c'] = square(np.array(data.a))

来源

2016-02-16 06:47:21 MaxGu

我觉得比较好用的是data ['c'] = data ['a']。apply（square）' – jezrael

Python Pandas：基于其他列添加列

回答

相关问题