使用bootstrap进行分层排列

我在尝试对排列进行分层时遇到问题。使用bootstrap进行分层排列

我的数据是这样的：

 gender party  value 
1  F Democrat  762 
2  M Democrat  484 
3  F Independent 327 
4  M Independent 239 
5  F Republican 468 
6  M Republican 477

什么，我只是试图做的是party

library(dplyr) 
md %>% 
    group_by(party) %>% 
    mutate(perm = sample(gender))

，给了我一个正确的随机排列，以分层随机排列

 gender party  value perm 
1  F Democrat  762  M 
2  M Democrat  484  F 
3  F Independent 327  M 
4  M Independent 239  F 
5  F Republican 468  F 
6  M Republican 477  M

我想多次重复此操作。继提出的解决方案here（非分层排列）

library(broom) 
md %>% 
bootstrap(100) %>% 
do(data.frame(., treat = sample(.$gender, 6, replace=TRUE)))

不过，我没能引进group_by说法。

md %>% 
    bootstrap(10) %>% 
    group_by(party) %>% 
    do(data.frame(., treat = sample(.$gender, 6, replace=TRUE)))

有什么想法吗？

另外，bootstrap功能其实很慢。任何想法为什么？任何解决方案，使其更快？我们可以以某种方式平行吗？

library(reshape2) 
M <- as.table(rbind(c(762, 327, 468), c(484, 239, 477))) 
dimnames(M) <- list(gender = c("F", "M"), 
       party = c("Democrat","Independent", "Republican")) 
md = melt(M)

来源

2016-09-30 giacomo

是否'MD％>％GROUP_BY（方）％>％的自举（10，by_group = TRUE）％>％的人（ data.frame（。，treat = sample（。$ gender，6，replace = TRUE）））'work？ – Axeman

您写过，*我想多次重复此操作*但预期输出是多少？使用'replicate'怎么样？ – agstudy

@agstudy复制是一种可能性，我在提到的问题中使用它。它只是使代码繁琐。 – giacomo

这里使用data.table（如果你正在寻找的表现，你真的应该给它一个去）封装，replicate一个解决方案：

setDT(dx) 
rbindlist(replicate(10,dx[,perm := sample(gender),party],simplify=FALSE))

我不是dplyr既不是吹笛的用户，但如果你的一个 “管痴” 你可以将上面的代码和管道它：

PERM <- function(dx) 
    dx[,perm := sample(gender),party] 

REPLICATE <- function(dx,n) 
    rbindlist(replicate(n,dx[,perm := sample(gender),party],simplify=FALSE)) 

dx %>% 
    PERM() %>% 
    REPLICATE(10)

来源

2016-09-30 11:52:28 agstudy

非常感谢 – giacomo

使用bootstrap进行分层排列

回答

相关问题