2016-11-04 336 views
-3

假设我们有两列C1和C2都是连续变量,我们的任务是“我们必须将C1列按seq(3,13.5,0.5)分组并且取决于对没有在每一个宾未来点我们分别为“enter image description here如何将连续变量按R组进行分组

+0

C2的用意是什么? “对某些数据”没有意义。这似乎是“汇总数据”的拼写错误,但汇总来自另一个变量的数据不会增加点数。 – Bernhard

+0

@Bernhard分组应该按照binning列应该是seq(3,13.5,0.5)的组并且其他列的总和数(C2) –

+0

对不起。我已经回答了一半,但下半场我不明白。 – Bernhard

回答

0

要组列C1由给定的断点必须一些C2的数据点,存在作为R北京时间的cut命令:

C <- data.frame(C1=runif(30)) 
C$group <- cut(C$C1, c(0, .2, .4, .6, .8, 1)) 
print(C) 

的可以使用table显示每个组/箱的点数:

table(C$group) 
0
m<- seq(3,13.5,0.5) 
C$bin_grouping <- cut(C$C1,m) 
#Once i have Bin_grouping further i Used Dplyr Package as such to sum C2 Column 
by_bin<-group_by(C,bin_grouping) 
new_C <-summarise(by_bin,new_C2=sum(C2, na.rm = TRUE),Count=n())