2015-02-09 49 views
1

如何更改数据框以便将行索引用作列标题?将索引行作为列标题

我有这样的数据:

0 1.052 
1 0.542 
2 0.496 
3 0.402 
4 0.278 
0 5.115 
1 4.329 
2 4.121 
3 4.075 
4 4.0088 
... 

我想获得它让我获得与指数列标题,其指数在第二列的矩阵?

+0

我只是用第一个解决方案,我得到了becouse它的工作对什么即时试图做的,我不介意的错误信息,林有R真的不好,所以我尽量避免这样做,以复杂的东西 – user3700660 2015-02-10 13:10:08

回答

2

你只需要使用矩阵功能和更改的byrow默认值:

## Create some example data 
dd = data.frame(x = 0:4, y=runif(5*5)) 

## Specify the number of columns 
## Order by Row 
matrix(dd[,2], ncol=length(unique(dd[,1])), byrow = TRUE) 
0

不知道我明白你的意思,但似乎你愿意把一个列标题,或关键。在这种情况下,我只想建议使用data.table包,尤其是setkey功能

1

这里是一个可能的data.table溶液(您没有提供列名,所以我认为这是V1V2

library(data.table) 
setDT(df)[, indx := cumsum(V1 == 0)] 
dcast(df, indx ~ V1, value.var = "V2") 
# indx  0  1  2  3  4 
# 1: 1 1.052 0.542 0.496 0.402 0.2780 
# 2: 2 5.115 4.329 4.121 4.075 4.0088 

或者更简单的(由@akrun提议)

library(reshape2) 
acast(df, cumsum(V1 == 0) ~ V1, value.var = 'V2') 

数据

df <- structure(list(V1 = c(0L, 1L, 2L, 3L, 4L, 0L, 1L, 2L, 3L, 4L), 
     V2 = c(1.052, 0.542, 0.496, 0.402, 0.278, 5.115, 4.329, 4.121, 
     4.075, 4.0088)), .Names = c("V1", "V2"), class = "data.frame", row.names = c(NA, 
    -10L)) 
+1

基本上我想说'library(reshape2);如果OP想要一个矩阵输出,那么acast(df,cumsum(V1 == 0)〜V1,value.var ='V2') – akrun 2015-02-09 12:40:26

+0

@akrun OP表示他们有一个数据帧,但接受了一个矩阵解,所以我'我不确定他们真的有什么 – 2015-02-09 12:42:53

+1

接受的解决方案的问题是,假设如果其中一个组合不存在即ie。 'dd < - dd [-10,]',你会收到警告信息 – akrun 2015-02-09 12:45:31

0

可以使用unstack

unstack(dat, y ~ x) 

其中dat是数据帧的名称,x是第一(指示器)列的名称,并y是第二的名称(值)列。

一个例子:

set.seed(1) 
dat <- data.frame(x = 0:4, y = rnorm(10)) 
# x   y 
# 1 0 -0.6264538 
# 2 1 0.1836433 
# 3 2 -0.8356286 
# 4 3 1.5952808 
# 5 4 0.3295078 
# 6 0 -0.8204684 
# 7 1 0.4874291 
# 8 2 0.7383247 
# 9 3 0.5757814 
# 10 4 -0.3053884 

unstack(dat, y ~ x) 
#   X0  X1   X2  X3   X4 
# 1 -0.6264538 0.1836433 -0.8356286 1.5952808 0.3295078 
# 2 -0.8204684 0.4874291 0.7383247 0.5757814 -0.3053884