我想将数据帧转换为某种格式。我一直在使用dplyr,reshape2等来实现这一点。基本上,我以如下数据框开头:在R操作数据帧:可能使用dplyr和reshape2
library(dplyr)
library(plotly)
library(data.table)
library(reshape2)
set.seed(1)
data <- data.frame(ID = paste0("ID",1:10), A = runif(10), B = runif(10), C = runif(10), D = runif(10), E = runif(10), fill = factor(rep("gray", 10), levels = c("gray", palette)))
data$ID <- as.character(data$ID)
这创建了以下格式的数据框。
ID A B C D E fill
1 ID1 0.2655087 0.2059746 0.9347052 0.4820801 0.8209463 gray
2 ID2 0.3721239 0.1765568 0.2121425 0.5995658 0.6470602 gray
3 ID3 0.5728534 0.6870228 0.6516738 0.4935413 0.7829328 gray
4 ID4 0.9082078 0.3841037 0.1255551 0.1862176 0.5530363 gray
5 ID5 0.2016819 0.7698414 0.2672207 0.8273733 0.5297196 gray
6 ID6 0.8983897 0.4976992 0.3861141 0.6684667 0.7893562 gray
我会保留这个“数据”数据框以备将来之用。但是,我需要重新安排它来创建一个新的数据帧(现在称为“dat_long”)如下:
datt <- data.frame(t(data))
names(datt) <- as.matrix(datt[1, ])
datt <- datt[-1, ]
datt[] <- lapply(datt, function(x) type.convert(as.character(x)))
setDT(datt, keep.rownames = TRUE)[]
colnames(datt)[1] <- "x"
dat_long <- melt(datt, id.vars ="x")
这导致以下结构:
head(dat_long,12)
x variable value
1: A ID1 0.26550866
2: B ID1 0.2059746
3: C ID1 0.93470523
4: D ID1 0.4820801
5: E ID1 0.8209463
6: fill ID1 gray
7: A ID2 0.37212390
8: B ID2 0.1765568
9: C ID2 0.21214252
10: D ID2 0.5995658
11: E ID2 0.6470602
12: fill ID2 gray
这是几乎数据我想要的框架。但是,我真正想要的是如下所示:
head(dat_long,12)
x variable value fill
1: A ID1 0.26550866 gray
2: B ID1 0.2059746 gray
3: C ID1 0.93470523 gray
4: D ID1 0.4820801 gray
5: E ID1 0.8209463 gray
6: A ID2 0.37212390 gray
7: B ID2 0.1765568 gray
8: C ID2 0.21214252 gray
9: D ID2 0.5995658 gray
10: E ID2 0.6470602 gray
填充可能不总是“灰色”。但是对于给定的ID变量(ID1,ID2等),它应该在所有五行上具有相同的颜色。
你会怎么劝我来完成这个目标?
与'melt'尝试并使用'id.var'为“ID”和 '补',即'库(data.table);熔体(setDT(数据),身份证.var = c(“ID”,“fill”))[order(ID)]' – akrun