2017-09-05 49 views
0

我试图在dask数据框中添加一列,但它不让我添加列表类型的列,所以我达到了一点点,发现它会添加一个dask系列。但是我无法将我的列表转换为dask系列。你能帮我吗?初始化一个dask系列

+2

这将是更好,如果你给你所期望的工作,在它失败的方式代码的全部细节:代码和错误/追溯。 – mdurant

回答

0

您可以将列表转换为大熊猫数据帧,如果它能够装入内存:

import pandas as pd 
import dask.dataframe as dd 
import numpy as np 

df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)), 
columns=list('ABCDEF')) data = dd.from_pandas(df, npartitions = 2) 

listadd = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20] 
listadd = pd.DataFrame(listadd) 

data[['G']] = listadd 

print data.compute() 
+0

是的,但它不适合。 :/ –

+0

该列表适合但Dataframe不适用? – user48944

+0

是的,列表几乎不占用内存的75%左右,但使用熊猫时数据框不会显示。 –