分割的大熊猫细胞列表为多列

我有一个非常简单的Pandasdataframe其中每个单元包含一个列表。我想将列表中的每个元素分成它自己的列。我可以通过导出值然后创建一个新的dataframe。这似乎不是一个好办法尤其是做到这一点，如果我的dataframe从列表中列有一列备用。分割的大熊猫细胞列表为多列

import pandas as pd 

df = pd.DataFrame(data=[[[8,10,12]], 
         [[7,9,11]]]) 

df = pd.DataFrame(data=[x[0] for x in df.values])

所需的输出：

如果我确实有第二列：

df = pd.DataFrame(data=[[[8,10,12], 'A'], 
         [[7,9,11], 'B']])

我怎么不松动基于@Psidom答案

0 1 2 
0 8 10 12 
1 7 9 11

后续另一列？

所需的输出：

0 1 2 3 
0 8 10 12 A 
1 7 9 11 B

来源

2016-12-02 user2242044

'DF [0]。适用（pd.Series）'适用于你的榜样。 – Psidom

@Psidom完美！为什么不作为答案提交。 – user2242044

您可以通过与apply()功能的系列循环，每个列表转换为Series，这会自动展开列表作为一系列在列方向：

df[0].apply(pd.Series) 

# 0 1 2 
#0 8 10 12 
#1 7 9 11

更新：为了保持数据帧等栏目，你可以用你想保留的列串连结果：

pd.concat([df[0].apply(pd.Series), df[1]], axis = 1) 

# 0 1 2 1 
#0 8 10 12 A 
#1 7 9 11 B

来源

2016-12-02 03:42:00 Psidom

我能不松动的附加列（修改原来的问题）？ – user2242044

您需要'pd.concat（）'方法。查看更新！ – Psidom

你可以做pd.DataFrame(df[col].values.tolist()) - 要快得多〜500个

In [820]: pd.DataFrame(df[0].values.tolist()) 
Out[820]: 
    0 1 2 
0 8 10 12 
1 7 9 11 

In [821]: pd.concat([pd.DataFrame(df[0].values.tolist()), df[1]], axis=1) 
Out[821]: 
    0 1 2 1 
0 8 10 12 A 
1 7 9 11 B

时序

中

In [828]: df.shape 
Out[828]: (20000, 2) 

In [829]: %timeit pd.DataFrame(df[0].values.tolist()) 
100 loops, best of 3: 15 ms per loop 

In [830]: %timeit df[0].apply(pd.Series) 
1 loop, best of 3: 4.06 s per loop

大

In [832]: df.shape 
Out[832]: (200000, 2) 

In [833]: %timeit pd.DataFrame(df[0].values.tolist()) 
10 loops, best of 3: 161 ms per loop 

In [834]: %timeit df[0].apply(pd.Series) 
1 loop, best of 3: 40.9 s per loop

来源

2017-10-12 08:10:20 Zero

分割的大熊猫细胞列表为多列

回答

相关问题