2017-04-19 48 views
1

日期购买销售值的数据帧,并在该数据帧做pivot_table获得其中工程每个日期的所有买入/卖出价值。熊猫pivot_table工作不同的一点不同的数据

data = [('20170325', 'Buy', 400), 
     ('20170325', 'Buy', 401), 
     ('20170323', 'Buy', 400), 
     ('20170324', 'Sell', 400)] 

testDf = pd.DataFrame(data, columns=['Date', 'Scenario', 'Value']) 
df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', 
        fill_value = '', aggfunc=lambda x: x.tolist() if len(x)>1 else x) 
df1 
# Scenario   Buy Sell 
# Date      
# 20170323   400  
# 20170324    400 
# 20170325 [400, 401] 

但是,当我的数据修改了一下,pivot_table抛出错误:ValueError异常:功能不减少。无法理解为什么。这是不同数据的错误。请注意,日期的更改为。

data = [('20170321', 'Buy', 400), 
     ('20170321', 'Buy', 401), 
     ('20170323', 'Buy', 400), 
     ('20170324', 'Sell', 400)] 

testDf = pd.DataFrame(data, columns=['Date', 'Scenario', 'Value']) 
df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', 
        fill_value = '',aggfunc=lambda x: x.tolist() if len(x)>1 else x) 

Traceback (most recent call last): File "", line 1, in
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\tools\pivot.py", line 114, in pivot_table
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 729, in agg
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 2978, in aggregate
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1227, in _python_agg_general
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1733, in agg_series
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1767, in _aggregate_series_pure_python
ValueError: Function does not reduce

+0

作为@ScottBoston以下提到,在两个数据集中出现的错误。 – Parfait

回答

0

我与你的第一个数据集也得到了同样的错误。我相信这是由于一天中重复的值。

这似乎是大熊猫的一个特征从这个SO post.

让我们尝试你tolist()来使用,而不是元组转换。

df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', fill_value = '',aggfunc=lambda x: tuple(x)) 
+0

但是有一个想法,如果使用'lambda x:tuple(x)if len(x)> 1 else x)'它是如何工作的? – jezrael

+0

我不认为它会工作,因为混合类型可能仍然不会减少。不,有条件的最后杀死它也。 –

+0

@ScottBoston Tuple作品。但想知道为什么列表没有。奇怪的是,我没有得到我的第一个数据集的任何错误。可能与熊猫版有关吗?我正在使用v0.17.1。 – Nilanjan

1

考虑甚至是groupbypivot

df1 = testDf.groupby(['Date', 'Scenario'])['Value'].apply(lambda x: list(x)).reset_index()\ 
      .pivot(index='Date', columns='Scenario', values='Value').fillna('') 

# Scenario   Buy Sell 
# Date      
# 20170323  [400]  
# 20170324    [400] 
# 20170325 [400, 401]  

# Scenario   Buy Sell 
# Date      
# 20170321 [400, 401]  
# 20170323  [400]  
# 20170324    [400]