2017-10-19 148 views
0

我试图显示具有5种不同颜色的散点图:每个'district'一个。不幸的是我有这样的错误显示出来:Invalid RGBA argument: nan无效的RGBA参数:nan

我的数据框看起来是这样的:

>   price surface district 
>  0 1850  46   1.0 
>  1 1900  41   4.0 
>  2 1925  55   4.0 
>  3 1960  52   2.0 
>  4 2025  57   3.0 
>  5 2055  60   10.0  
    ... ...  ...   ... 

这里是我做的:

colors =['red', 'pink', 'limegreen', 'violet', 'cyan'] 

color_dict = dict(zip(np.unique(house['district']),colors)) 

因此颜色dictionnary看起来是这样的:

{1.0: 'red', 2.0: 'pink', 3.0: 'limegreen', 4.0: 'violet', 10.0: 'cyan'} 

然后我创建了一个变量col:

col = house['district'].map(color_dict) 

最后,我画的情节:

df.plot(kind = 'scatter', x = 'surface', y = 'price', c = col) 

有人能解释这里的问题?

+1

如果你的数据框有NaN值,为什么不直接调用'df.dropna()'? –

+1

事实上,你必须有NaN值。仅根据您迄今提供的数据,我无法复制您的问题。 – Reti43

回答

0

因此,似乎在我的数据框中有某处存在Nan值,即使我没有发现它们。 正如@coldspeed所示,我只需要调用df.dropna()。

耻辱我! ;)