2015-11-19 93 views
0

我有一个大型数据集,我需要读作熊猫数据框。索引熊猫数据框boxplot的新列

减去含有价格信息(如浮子)

然后上绘制箱线图中价格差异2列(根据时间分组所属的)

我努力获得了“新列“索引和被读作‘浮动’正确绘制它,我也得到错误

Value is trying to be set on a copy of a slice from a  
DataFrame. Try using .loc[row_indexer,col_indexer] = value instead 

我需要了解如何确保‘新列’是一个浮动和可编入索引我的Boxplot函数可以正确绘制。

BXdf['priceDelta'] = BXdf.searchPrice.fillna(BXdf.bookedPrice) 
BXdf['priceDelta'] = BXdf[[ 'searchPrice']].subtract(BXdf['bookedPrice'] 
                , axis=0) 

a = BXdf.boxplot(column='priceDelta' ,by='timebucket',sym='k+',vert=False 
         ,widths=0.8,notch=True,bootstrap=1000,figsize=[24,12]) 

箱线图绘制,而是给出了所有的子集0值

print(BXdf['priceDelta'].head) 

给人

Name: priceDelta, dtype: float64> 

我有一种感觉它是值得做的.loc或正在重置索引在pricedelta列中,但我真的很难解决它。

感谢

回答

0

尝试:

BXdf['priceDelta'] = BXdf['searchPrice'] - BXdf['bookedPrice']