我有一个数据帧,它具有以下结构和两列data1
和data2
。下面是样本数据:查看列表中每1000000个列的平均值R
data1 data2
800000 1
800030 0.956521739130435
1000000 0.480916030534351
1686626 0.496
1687492 0.174757281553398
2148463 0.0344827586206897
2850823 0.05
2959087 0.0416666666666667
我想计算第二行即data2
的平均值为每百万计数data1
。 这意味着它应该给出前2行的平均值,然后是下3行,然后是下3行,等等......
输出应该是一个数据帧,其中最后一个值在间隔1000000内,在该区间data2
值:示例输出如下所示:
800030 0.97826087
1687492 0.38389110
2959087 0.04204981
能有所帮助R中做到这一点?
就像一个念头:我不知道你在做什么,但你不是在计算一个加权平均值吗?即对于前面的1e6次观测,意思是(1 * 0.8e6 + 0.95 ... * 30 + 0.48 ... * 199970)/ 1e6。这将是第一个1e6计数的平均值,而不是前3个不同结果的平均值。 – 2013-04-09 12:34:26