我有data.frame:错误dplyr总结
set.seed(1L)
vector <- data.frame(patient=rep(1:5,each=2),medicine=rep(1:3,length.out=10),prob=runif(10))
我想要得到的“概率”列平均值,而由病人分组。我用下面的代码这样做:
vector %>%
group_by(patient) %>%
summarise(average=mean(prob))
此代码完美的作品。但是,我需要得到相同的值,而不使用在“总结”行字“概率”。我想下面的代码,但它给了我一个data.frame中,列“平均”是5个相同的价值观,这是不是我想要一个向量:
vector %>%
group_by(patient) %>%
summarise(average=mean(vector[,3]))
PD:为便于理解为什么我需要这个,我有一个复杂的名称需要进行“总结”,这就是为什么我不能在总结命令把一个一个多列另一个数据帧。我想要的是在那里放置一个矢量来计算由病人分组的每列的probs。
我可以提议首先将数据纳入作进一步处理最方便的格式?你最后的评论暗示,首先熔化数据,然后将你提出既可以是一个有前途的方法的工作代码。 – 2014-09-18 23:05:27
我认为这是[目前在作品(https://github.com/hadley/dplyr/issues/352),连接到[懒](https://github.com/hadley/lazyeval)封装 – baptiste 2014-09-18 23:52:08
谢谢彼得,这实际上解决了我的问题!我融化并“挖掘”了数据框。 – Victor 2014-09-20 15:12:02