2011-04-18 68 views
3

我有一个文件,其中在每一行我有一个数字值象征的平均持续时间:R + GGPLOT2 - 集合数据由区间

12.3 
5.4 
6 
... 

有R中某种方式显示在自动或手动数据间隔/间隔(聚合?)。就像这样:

[0,1[ 0 
[1, 6[ 1 
[6, 20[ 2 
... 

另外,接下来我想在ggplot2中产生一个显示这些数据的图。我可以使用这些间隔作为标签吗?

回答

4

您可以在基数R中使用cut()函数对数据进行分箱或使用Hmisc软件包和cut2()。关于如何切割和切片数据有几种选择,所有这些选项分别记录在help(cut)help(cut2)中。

一旦你正确分级数据,与ggplot密谋成为一个平凡的工作:

library(ggplot2) 
#Sample data 
set.seed(1) 
dat <- data.frame(x = sample(1:100, 1000, TRUE)) 
dat$cuts <- cut(dat$x, breaks = 5) 

#Make bar chart 
qplot(dat$cuts)