我开始学习熊猫,并试图找到最棘手的(或熊猫吞噬?)方式来完成某些任务。熊猫集团的绘图结果
假设我们有一个列的数据帧A,B和C
- 列A包含布尔值:每行的值是true或false。
- B列有一些我们想要绘制的重要值。
我们想要发现的是,将A设置为false的行的B值与A的A行为真的行的B值之间的细微区别。
换句话说,如何根据列A的值(true或false)进行分组,然后在同一个图上绘制两个组的列B的值?这两个数据集应该有不同的颜色,以便能够区分这些点。
接下来,让我们添加另一个特点是此程序:图形之前,我们要计算每行的另一个值并将其存储在列D.此值存储在B中整个所有数据的平均值创纪录的前五分钟 - 但我们只包括具有存储在A.
换句话说,如果我有一排相同的布尔值行,其中A=True
和time=t
,我要计算列d的值是从时间t-5
到t
的所有记录的B的均值,其具有相同的A=True
。
在这种情况下,我们如何执行groupby的A值,然后将这个计算应用到每个单独的组,然后绘制这两个组的D值?
你有一些例子dataframes?看起来像你可以做一些事情,比如将groupby对象保存在一个变量中:'grouped = df.groupby('A')',然后做一个for-loop来绘制:'g,d in groupped:plot(d [ 'B'],color = g)'。第二个问题或多或少都是一样的,你可以使用熊猫'rolling_mean'来创建新的列D. – herrfz 2013-03-17 20:26:19