假设我有一个数据框按2个因子分组。有没有办法用dplyr
对数据组进行采样? (注:不样品内组)有没有办法在分组的数据帧中对数据组进行采样(dplyr)
例如:
DF <- data.frame(A = rep(LETTERS[1:4], each = 6),
B = rep(c(1:2), 12),
C = rnorm(24))
# base r solution
DF$group_var <- paste(DF$A, DF$B, sep = "_")
DF_sample <- DF[DF$group_var %in% sample(unique(DF$group_var), 3), ]
#possible dplyr solution?
DF_sample <- DF %>% group_by(A,B) %>% sample_group_of_data(3)
我推测'DF%>%过滤器(group_var%in%sample(unique(DF $ group_var),3,replace = F))'不够dplyr-oïd? –
恐怕不行:-)我仍然需要创建分组变量并且手动采样。唯一的'dplyr'加法是'filter'来代替'[' – Latrunculia