根据其他列中的因子计算一列中R的平均值和标准偏差

我想计算“skada”列中取决于另外三列的数据的平均值和标准偏差。我的表看起来像这样：根据其他列中的因子计算一列中R的平均值和标准偏差

的 “geografi” 列有分类变量：SV，NV，男，SO，SV

的 “gradering” 列有分类变量：1，2

的“制地图”列具有分类变量：20M，康德

换句话说，这意味着我将不得不为SV，1,2-平均值和标准偏差0米; SV，2,20m; SV，1，康得; SV，2，康德; NV，1,20米......等等。有没有人有关于如何轻松做到这一点的任何提示？

干杯！

画面不重复的例子 – simone

型'data.table'或看'dplyr'的'？ group_by' – simone

您可以使用data.table：

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
       by = c("geografi", "gardering", "plats")]

或dyplr：

library(dplyr) 

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value))

2017-07-28 14:00:07 gcons

非常感谢gcons。我试过data.table，它工作得很完美。从现在开始，对于大量表格，没有更多的优势。 –

回答