-3
假设我们有两列C1和C2都是连续变量,我们的任务是“我们必须将C1列按seq(3,13.5,0.5)分组并且取决于对没有在每一个宾未来点我们分别为“如何将连续变量按R组进行分组
假设我们有两列C1和C2都是连续变量,我们的任务是“我们必须将C1列按seq(3,13.5,0.5)分组并且取决于对没有在每一个宾未来点我们分别为“如何将连续变量按R组进行分组
要组列C1由给定的断点必须一些C2的数据点,存在作为R北京时间的cut
命令:
C <- data.frame(C1=runif(30))
C$group <- cut(C$C1, c(0, .2, .4, .6, .8, 1))
print(C)
的可以使用table
显示每个组/箱的点数:
table(C$group)
m<- seq(3,13.5,0.5)
C$bin_grouping <- cut(C$C1,m)
#Once i have Bin_grouping further i Used Dplyr Package as such to sum C2 Column
by_bin<-group_by(C,bin_grouping)
new_C <-summarise(by_bin,new_C2=sum(C2, na.rm = TRUE),Count=n())
C2的用意是什么? “对某些数据”没有意义。这似乎是“汇总数据”的拼写错误,但汇总来自另一个变量的数据不会增加点数。 – Bernhard
@Bernhard分组应该按照binning列应该是seq(3,13.5,0.5)的组并且其他列的总和数(C2) –
对不起。我已经回答了一半,但下半场我不明白。 – Bernhard