我有一个复杂的函数,为Pandas
dataframe
中的每一行生成一个list
。我想在这个新列中的每一行中输入值mylist
。通过apply将一个静态列表添加到一个新的Pandas Dataframe列
熊猫这样做的能力似乎取决于起始数据框中的列数。
import pandas as pd
df = pd.DataFrame(data=[['A', 'D'],
['B', 'E'],
['C', 'F']],
columns=['col1', 'col2'])
df1 = pd.DataFrame(data=[['A', 'D', 'G'],
['B', 'E', 'H'],
['C', 'F', 'I']],
columns=['col1', 'col2', 'col3'])
def add_list(row):
return [1,3, 3]
df['mylist'] = df.apply(add_list, axis=1)
print df
收率:
col1 col2 list
0 A D [1, 3, 3]
1 B E [1, 3, 3]
2 C F [1, 3, 3]
该附加代码产生ValueError: Wrong number of items passed 3, placement implies 1
。为什么起始dataframe
中的列数有影响?
df1['mylist'] = df1.apply(add_list, axis=1)
print df1
如果我改变功能到下方(添加一种元素),则不存在错误:
def add_list(row):
return [1,3, 3, 4]
预期输出:
col1 col2 col3 list
0 A D G [1, 3, 3]
1 B E H [1, 3, 3]
2 C F I [1, 3, 3]
您要查找的实际输出是什么? –
@JoeR增加了预期的输出 – user2242044