数据帧与熊猫

DataFrames的我已经在2个测量A和B的以下数据帧采集每日统计：数据帧与熊猫

    A    B 
count 17266.000000 17266.000000 
std  0.179003  0.178781 
75%  101.102251 101.053214 
min  100.700993 100.651956 
mean  101.016747 100.964003 
max  101.540214 101.491178 
50%  100.988465 100.938694 
25%  100.885251 100.830048

下面是一段代码创建它：

day1 = { 
    'A': { 
    'count': 17266.0, 
    'std': 0.17900265293286116, 
    'min': 100.70099294189714, 
    'max': 101.54021448871775, 
    '50%': 100.98846526697825, 
    '25%': 100.88525124427971, 
    '75%': 101.10225131847992, 
    'mean': 101.01674677794136 
    }, 
    'B': { 
    'count': 17266.0, 
    'std': 0.17878125983374854, 
    'min': 100.65195609992342, 
    'max': 101.49117764674403, 
    '50%': 100.93869409089723, 
    '25%': 100.83004837814667, 
    '75%': 101.05321447650618, 
    'mean': 100.96400305527138 
    } 
} 
df = pandas.DataFrame.from_dict(day1, orient='index').T

的数据来从describe（）中取出。我有几个这样的描述（每天一个），我想将它们全部收集到一个单一的数据框中，该数据框以日期为索引。

最明显的获取方法是将所有日常结果叠加到一个数据框中，然后按日期对其进行分组并在结果上运行统计信息。不过，我想要一个替代方法，因为我遇到了一个MemoryError和我处理的数据量。

的最终结果应该是这样的：

     A   B  
2014-12-24 count 15895.000000 15895.000000 
     mean  99.943618  99.968860 
     std  0.012468  0.011932 
     min  99.877695  99.928778 
     25%  99.934890  99.960445 
     50%  99.943453  99.968847 
     75%  99.952340  99.977571 
     max  99.982930 100.002507 
2014-12-25 count 16278.000000 16278.000000 
     mean  99.937056  99.962203 
     std  0..012661 
     min  99.884501  99.910567 
     25%  99.928078  99.953758 
     50%  99.936754  99.962411 
     75%  99.945914  99.971473 
     max  99.981512 100.003770

来源

2015-02-06 Christophe

您是否可以制作“{date：describe_df_for_that_day}”的字典？然后你可以使用'pd.concat（dict）' – joris 2015-02-06 15:39:13

是的，我当然是...这简直太简单了，但它很好用，谢谢！如果您将评论升级为答案，我会很乐意接受。 – Christophe 2015-02-06 21:09:09

如果你能做出的字典{日期：describe_df_for_that_day}，那么你可以使用pd.concat(dict)。

与df开始：

In [14]: d = {'2014-12-24': df, '2014-12-25': df} 

In [15]: pd.concat(d) 
Out[15]: 
          A    B 
2014-12-24 count 17266.000000 17266.000000 
      std  0.179003  0.178781 
      75%  101.102251 101.053214 
      min  100.700993 100.651956 
      mean  101.016747 100.964003 
      max  101.540214 101.491178 
      50%  100.988465 100.938694 
      25%  100.885251 100.830048 
2014-12-25 count 17266.000000 17266.000000 
      std  0.179003  0.178781 
      75%  101.102251 101.053214 
      min  100.700993 100.651956 
      mean  101.016747 100.964003 
      max  101.540214 101.491178 
      50%  100.988465 100.938694 
      25%  100.885251 100.830048

当然你可以使按键实际日期，而不是字符串。

来源

2015-02-07 09:19:51 joris

数据帧与熊猫

回答

相关问题