我有一系列具有相同结构的数据框,代表一年中每个小时的模拟结果。每个模拟包含一系列坐标(x,y)的结果。熊猫多指数从数据框系列
每个数据帧都是从csv文件导入的,该文件只在文件名中包含时间信息。例如:
results_YYMMDDHH.csv
包含这样
x y a b
0.0 0.0 0.318705 -0.871259
0.1 0.0 -0.937012 0.704270
0.1 0.1 -0.032225 -1.939544
0.0 0.1 -1.874781 -0.033073
数据我想创建单个MultiIndexed数据帧(0电平是时间和级别1是(X,Y)),让我来执行各种像使用重采样或groupby方法的这些数据帧之间的平均值,总和,最大值等操作。对于每一个时间步长
产生的数据帧应该是这个样子
x y a b
2010-01-01 10:00 0.0 0.0 0.318705 -0.871259
0.1 0.0 -0.934512 0.745270
0.1 0.1 -0.0334525 -1.963544
0.0 0.1 -1.835781 -0.067573
2010-01-01 11:00 0.0 0.0 0.318705 -0.871259
0.1 0.0 -0.923012 0.745670
0.1 0.1 -0.035225 -1.963544
0.0 0.1 -1.835781 -0.067573
.................
.................
2010-12-01 10:00 0.0 0.0 0.318705 -0.871259
0.1 0.0 -0.923012 0.723270
0.1 0.1 -0.034225 -1.963234
0.0 0.1 -1.835781 -0.067233
你可以想像这在今年的每个小时。现在我想能够计算全年的平均值或六月份的平均值。 还有其他任何功能,如高于某个阈值的小时数或最小值与最大值之间的小时数。请记住,结果应该在这些操作的任何一个DataFrame中。例如,每月平均值应该看起来像
x y a b
2010-01 0.0 0.0 0.45 -0.13
2010-02 0.1 0.0 0.55 -0.87
2010-03 0.1 0.1 0.24 -0.83
2010-04 0.0 0.1 0.11 -0.87
如何构建此多索引数据框?我把它描绘成一个数据帧的时间序列。
为什么你认为这需要multiindexed?它似乎只需要一个索引即文件的时间戳。你想要的输出fwiw是单索引的。 – acushner 2015-02-26 19:16:26
你有一点。道歉,我一直在看这些数据很长时间,我觉得其他人都知道他们!我已经进一步澄清。 – Rojj 2015-02-26 19:40:24