在R中,我有一个大型数据框的列表,其中包含两列,分别为value
和count
。我在前面的步骤中使用的函数返回value
中的观察值,相应的列count
显示了观察到该特定值的次数。以下代码生成一个数据帧为例 - 但是列表中的所有数据帧都具有不同的值,值范围:汇总来自值和计数属性的数据
d <- as.data.frame(
cbind(
value = runif(n = 1856, min = 921, max = 4187),
count = runif(n = 1856, min = 0, max = 20000)
)
)
现在我想汇总数据以便能够创建可查看的可视化。此聚合应该应用于列表中的所有数据帧,每个数据帧具有不同的值范围。我正在寻找一种功能,将数据切割成新的值和计数,有点像直方图函数。因此,例如,对于所有数值为0到100的数值,计数应该加总(等等,在定义的时间间隔内,干净的间隔边界起点像0)。
我的第一个尝试是创建一个简单的值向量,其中每个值都重复了多次,由count
字段确定。然后,下一步将应用hist()
函数而不绘制以获得可以在hist()
的论点中定义的聚合值和计数。但是,这会产生太大的向量(每个有一些Gb),R无法再处理。我很欣赏任何解决方案或提示!