熊猫pivot_table工作不同的一点不同的数据

我日期，购买和销售值的数据帧，并在该数据帧做pivot_table获得其中工程每个日期的所有买入/卖出价值。熊猫pivot_table工作不同的一点不同的数据

data = [('20170325', 'Buy', 400), 
     ('20170325', 'Buy', 401), 
     ('20170323', 'Buy', 400), 
     ('20170324', 'Sell', 400)] 

testDf = pd.DataFrame(data, columns=['Date', 'Scenario', 'Value']) 
df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', 
        fill_value = '', aggfunc=lambda x: x.tolist() if len(x)>1 else x) 
df1 
# Scenario   Buy Sell 
# Date      
# 20170323   400  
# 20170324    400 
# 20170325 [400, 401]

但是，当我的数据修改了一下，pivot_table抛出错误：ValueError异常：功能不减少。无法理解为什么。这是不同数据的错误。请注意，日期的更改为。

data = [('20170321', 'Buy', 400), 
     ('20170321', 'Buy', 401), 
     ('20170323', 'Buy', 400), 
     ('20170324', 'Sell', 400)] 

testDf = pd.DataFrame(data, columns=['Date', 'Scenario', 'Value']) 
df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', 
        fill_value = '',aggfunc=lambda x: x.tolist() if len(x)>1 else x)

Traceback (most recent call last): File "", line 1, in
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\tools\pivot.py", line 114, in pivot_table
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 729, in agg
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 2978, in aggregate
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1227, in _python_agg_general
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1733, in agg_series
File "ext2\vc12_win32\lib\python2.7\site-packages\pandas\core\groupby.py", line 1767, in _aggregate_series_pure_python
ValueError: Function does not reduce

来源

2017-04-19 Nilanjan

作为@ScottBoston以下提到，在两个数据集中出现的错误。 – Parfait

我与你的第一个数据集也得到了同样的错误。我相信这是由于一天中重复的值。

这似乎是大熊猫的一个特征从这个SO post.

让我们尝试你tolist（）来使用，而不是元组转换。

df1 = pd.pivot_table(testDf, columns='Scenario', index='Date', values='Value', fill_value = '',aggfunc=lambda x: tuple(x))

来源

2017-04-19 14:33:58

但是有一个想法，如果使用'lambda x：tuple（x）if len（x）> 1 else x）'它是如何工作的？ – jezrael

我不认为它会工作，因为混合类型可能仍然不会减少。不，有条件的最后杀死它也。 –

@ScottBoston Tuple作品。但想知道为什么列表没有。奇怪的是，我没有得到我的第一个数据集的任何错误。可能与熊猫版有关吗？我正在使用v0.17.1。 – Nilanjan

考虑甚至是groupby与pivot：

df1 = testDf.groupby(['Date', 'Scenario'])['Value'].apply(lambda x: list(x)).reset_index()\ 
      .pivot(index='Date', columns='Scenario', values='Value').fillna('') 

# Scenario   Buy Sell 
# Date      
# 20170323  [400]  
# 20170324    [400] 
# 20170325 [400, 401]  

# Scenario   Buy Sell 
# Date      
# 20170321 [400, 401]  
# 20170323  [400]  
# 20170324    [400]

来源

2017-04-19 14:53:09 Parfait

熊猫pivot_table工作不同的一点不同的数据

回答

相关问题