2013-02-28 56 views
5

我有以下格式的.csv文件:如何按日期分组data.frame?

Date  ,  Time , Value 
1899-01-01 , 4:00:00 , 1 
1899-01-01 , 4:01:00 , 2 
1899-01-01 , 4:02:00 , 3 
1899-01-01 , 4:03:00 , 4 
1899-01-01 , 4:04:00 , 5 
1900-08-22 , 22:00:00 , 101 
1900-08-22 , 22:01:00 , 102 
2013-08-29 , 4:00:00 , 1000 
2013-02-29 , 4:02:00 , 1001 
2013-02-29 , 4:03:00 , 1002 

是否有可能group by date产生在以下格式的data.table

Date  , Vector(variable length) 
1899-02-28, c(1,2,3,4,5) 
1900-08-22, c(101,102) 
1900-08-22, c(1000,1001,1002) 

这是最好的,我有那么远(后尝试的天数):

raw <- read.csv(pathName, header = TRUE, stringsAsFactors = FALSE) 
groupedByDate <- split(raw, raw$Date) 

然而,这似乎产生一个非常宽的表,每个d一列吃,这是不是很接近我想要的。

回答

8

怎么样在data.frame名为“是myDF”作为使用aggregate如下:

> temp <- aggregate(Value ~ Date, mydf, as.vector) 
> temp 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 

“值”列现在是一个list其中包含您的载体。

> temp$Value 
$`0` 
[1] 1 2 3 4 5 

$`1` 
[1] 101 102 

$`2` 
[1] 1001 1002 

$`3` 
[1] 1000 

什么你可能寻找与split是:

> split(mydf$Value, mydf$Date) 
$`1899-01-01 ` 
[1] 1 2 3 4 5 

$`1900-08-22 ` 
[1] 101 102 

$`2013-02-29 ` 
[1] 1001 1002 

$`2013-08-29 ` 
[1] 1000 
+0

谢谢,这个作品绝对出色!我会将你的答案标记为答案,因为你是第一个。 – Contango 2013-02-28 18:48:58

3

使用aggregatepaste0

> aggregate(Value ~ Date, data=DF, FUN=paste0) 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 
+0

非常感谢你对此答案非常感谢。附:我其实想要一个数字矢量,所以它的“c”而不是“粘贴”。 – Contango 2013-02-28 18:50:54