0

我想计算“skada”列中取决于另外三列的数据的平均值和标准偏差。我的表看起来像这样:enter image description here根据其他列中的因子计算一列中R的平均值和标准偏差

的 “geografi” 列有分类变量:SV,NV,男,SO,SV

的 “gradering” 列有分类变量:1,2

的“制地图”列具有分类变量:20M,康德

换句话说,这意味着我将不得不为SV,1,2-平均值和标准偏差0米; SV,2,20m; SV,1,康得; SV,2,康德; NV,1,20米......等等。有没有人有关于如何轻松做到这一点的任何提示?

干杯!

+0

画面不重复的例子 – simone

+0

型'data.table'或看'dplyr'的'? group_by' – simone

回答

1

您可以使用data.table:

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
       by = c("geografi", "gardering", "plats")] 

或dyplr:

library(dplyr) 

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value)) 
+0

非常感谢gcons。我试过data.table,它工作得很完美。从现在开始,对于大量表格,没有更多的优势。 –

相关问题