2017-09-13 198 views
0

考虑我有一个数据框在三列长格式。 x列包含3个变量的名称,yz包含2个等级。有重复测量每个y变量:如何将长数据帧转换为宽重复数据/重复数据帧?

df <- data.frame(x=c(1:12), y=rep(0:2, 4), z=rep(letters[1:2], 6)) 
df$y <- as.factor(df$y) 
df <- arrange(df, y, z) 
df 

    x y z 
1 1 0 a 
2 7 0 a 
3 4 0 b 
4 10 0 b 
5 5 1 a 
6 11 1 a 
7 2 1 b 
8 8 1 b 
9 3 2 a 
10 9 2 a 
11 6 2 b 
12 12 2 b 

我怎样才能得到df_wide这个样子?

z 0 1 2 
a 1 5 3 
a 7 11 9 
b 4 2 6 
b 10 8 12 
+0

你能否解释这到底是怎么回事? – mtoto

+0

在df中,column-x是测量值,column-y是3个变量,column-z包含2个级别,并且每个列都具有用于列y变量的重复测量。希望这是明确的:)谢谢@ mtoto – datanew

回答

1
do.call(cbind, lapply(split(df, df$y), function(a) 
    setNames(object = data.frame(a$x, 
           row.names = paste0(as.character(a$z), 1:NROW(a))), 
      nm = a$y[1]))) 
# 0 1 2 
#a1 1 5 3 
#a2 7 11 9 
#b3 4 2 6 
#b4 10 8 12 
+0

谢谢!实际上,我有一个dfs列表。这个df是我列表中的一个元素。我如何在列表中实现do.call(...)代码? – datanew

1

data.table包装就变成了 “单行程序” 使用dcast()rowid()功能:

library(data.table) 
dcast(setDT(df), paste0(z, rowid(y, z)) ~ y, value.var = "x") 
z 0 1 2 
1: a1 1 5 3 
2: a2 7 11 9 
3: b1 4 2 6 
4: b2 10 8 12 
+0

作品!谢谢! – datanew